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Abstract of DE19807872 
The method involves one unit managing an 
associated number equal to some or all of a total 
number of configurable elements. 
Reconfiguration requests are sent from the 
elements to the unit The unit accepts no further 
requests and changes during processing; loads 
yet to be loaded configuration data of earlier 
requests from an intermediate memory into the 
configurable element; and converts the current 
request to a definite identifier or ID. The ID is 
converted to the address in the unit's memory of 
the configuration data to be loaded if the data 
exists in the memory. The data are requested 
from a superior unit if not present in the unifs 
memory. The data are loaded if the element can 
accept them. Data which cannot be accepted are 
p faced in temporary memory. When configuration 
data have been fully processed, new requests 
can be accepted, until when the configuration 
data yet to be loaded from earlier request are 
loaded into the configurable elements. 
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Die folsemten Angaben sand den vot 

Verfahren zur Verwaltung von Konfigurationsdaten in Datenflu&prozessoren sowie Bausteinen mit zwei- otter 
mehrdimensionalen programmierbaren Zellstruktur (FPGAs, DPGAs, o. dgl. 
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Beschreibung 

Huttergrund der Erfindung 

5 Stand der Technik 

Der Stand der Technik, wdcher diese Patentschrift zugrundeliegt, ist durch die Paten tanmeldung 196 54 846J2-53 
(Verfahren zum selbstandigen dynarnischen Umladen von DatenfluBprozessoren (DFPs) sowie Bausteinen mit zwci- 
oder mehrdimensionaler progranimietbaren Zellmatrix (FPGAs, DPGAs, o.dgl) und der PatemanmeldiiDg 196 54 
10 5935-53 (Umkonfigurierurigs Verfahren fur programmierbare Bausteine zur Laufzeit) beschriebeiL Darin wird ein \fer- 
fahren zur Konfiguration und Umkonfiguration von DFPs, sowie FPGAs, DFGAs und abnhchen Bausteinen nacb dem 
Stand der Technik, beschrieben, bei dem ein separat ausgestaUeter zentral Obergeordneter Mikrokontroller-Shnlicher 
Baustein die Verteilung von Konfigurationsdaten an mehrere untergeordnete, weitgebend passive Steueieinheiten fiber* 

mmmt- 

15 

Problems 

Durch den Einsatz einer zentralen und globalen Einheit, welche die Rekonfiguradon von Teilen eines oder mehrerer 
Bausteine steuert, komtntes zu Engpassen, wenn vicle verschiedene Rekonfiguradons-Anfragen auf etnmal behandelt 

20 werden mussen. Die \forteile der Paralleiitat, der bescbriebenen Bausteine, wird durch eine solche zentrale Enheit stark 
emgeschrankt, da er den typischen ir FlaschenhaIs' f darsteUl und die \ferarbeitung der Daten dadurcb erbebheh verlang- 
gamt Weiterhin ist die Zuordrmng der Ereignisquelle zu der zu ladenden Konfiguration problematiscb, da mit absoluten 
Adressen des Konfigurationsspeiebers gearbdtet wird Die Rekonfigurarions-Briheit muB also eine Art Speicherverwal- 
tungssystem beinhalten, welche, ahnlich wie in einem Beniebssystem, mitprotokoffiert, welche Spdcberbereicfa von 

25 welcher Konfiguration benutzt werden. 

Verbesserung durch die Erfindung, Aufgabe 

Die Grundaufgabe der vorliegenden Erfindung ist eine Eioheit - im Folgenden Konfigurationstabelle (CT) genannt 
30 die hierarchiach aufgebaut ist und auf jeder Ebene mehrfach vorkommen kann, wobei sich dSe Zahl der CB von der un- 
tersten Hiei-airhiestufe zur cbersten so vemngert, daB auf der bochsten Ebcnc genau eine CT vorbanden ist IcdcCT 
konfiguriert und kontrolliert unabhangig von anderen und parallel eine Mehrzahl von konfigurierbaren Elementen 
(CELs). CTs hoherer ffieraicbiestufen konnen Konfiguradonsroutinen fur tiererUegende CIs zwischenspekbenx Bend- 
tigen mehrere der tieferliegenden CIs ein und dieselbe Konfigurationsroutine, wird diese bet einer bdherliegenden CT 
35 zwischengespeicbert und von den einzelnen CIs abgerufen, wobei die heherliegende CT die betreffende Kbnfigurations- 
routine nur ein Mai aus eincm globalen gemeinsamen Konfigiiraiionsspeicher abruft, wodurch ein Cache-Effekt erzielt 
wild. Abseits konfigurierbarer Bausteine kann die vortiegende Erfindung als Cacheverrahien fQr Instruktions- und Da- 
tencache in Mikroprozessoren, DFP oder dgL mit mehreren Rechenwerken eingesetzt werden. Dabei konnen, je nacb 
Anwendung, einige der im Folgenden bescbriebenen Einheiten entfallen (z. B. FUMO), am merarcrrischen Aufbau an- 
40 dert sich jedoch grundlegend nichte, Dfeshalb wird dieser Einsatz als eine Teihnenge betrachtet und nicht wetter darauf 
eingegangen. 

Beschreibung der Erfindung 

45 Anstatt wie bisner eine zentrale und globale Einheit in einen Baustein zu integrieren, welche alle Konfigurations-An- 
forderungen bearbeitet, existieren nun eine Mehrzahl von merarchiscb (Baam-AMaMstruktur) angeordneten akdven Ein- 
heiten, welche diese Aufgabe ubernehmen konnen. Dabei wird eine Anforderung von der tiefesten Ebene (den Slattern 
in der Hierarchie) nur dann an die nSchst holier gelegene Ebene weitetgeleitet, wenn die Anforderung nieht bearbeitet 
werden konnte. Dkse Schritte werden fQr allc vorhandenen Ebenen wiederholt, bis die hocbst gelegene Ebene crreknt 

50 ist 

Die hoch&t gelegene Ebene ist an einen intemen oder extemen ubergeordneten Konrigurationspeicber angeschlossen, 
der alle jemals fur diesen Programlauf, benCtigteo Eonfiguralionsdaten enthalt 

Durch die Baumstruktur der Konfigurationseinheiten wird eine Art Cacheing der Konfigurationsdaten erreicht Zu- 
griffe auf Konftgurationen linden bauptsachlich lokal statt Im ungunstigsten Fall muB eine ^Configuration aus den Qber- 
55 geordneten Konfigurationsspeicher geladen werden, falls die betreffenden Daten in keiner der merarchiscb angeordneten 
CTs vorbanden sind. 

Die Grundlagen derCT 

60 Eine Konfigurationstabellc (CI) ist cine aktive Enheit, die auf Synchronisalionssignak, sogenannten Trigger (siehe 
DE 197 04 728.9), reagiert. Die Trigger werden von einer zwei- oder menrdimensionalen Matrix aus etektronischen 
Baugruppen, fur gewchnlich arithmentiscben oderlogischen Einheiten, Adressgeneratoren (sieheDE 196 54 595.1- 53X 
Recheneinheiten (sieheDE 19651 075.9), o.a. - im Folgenden konfigurierbare Elemente (CEL) genannt - geoeriert An- 
band des auftretenden Trigger wird eine bestimmte Aktion innerhalb der CT ausgelbst Dabei ist es Aufgabe der CT die 

65 Steucrung einer Mehrzahl von CELs zu ubemdimcn und deren arithmetiscben und/oder logischen Opcrauonen zu be- 
stimmeo. Insbesondere mussen CELs, entsprecbend DE 196 51 075.9 konfiguriert und umkonfiguriert werden. Diese 
Aufgabe urjerrumml eine CT, indem sie eine Mehrzahl von moglicben Konfiguradonsroutinen (KK), die ihrerseits je- 
weils aus einer Mehrzahl von einzelnen Konfigurationsworten (KW) bestehen, verwallet und erne Mehrzahl von CELs 
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aufgruDd von THggerbediogungeo nut einer oder mehrerer der KP konfigurieren. Dabei erhalt eine CEL jeweils eines 
oder mehrere der KonfiguraUonsworte, die rait der Adresse der zu konfigurierenden CEL versebeo sind. Bine KR mufi 
dabei vollstandig und konekt auf eine Mehrzabl von CELs abgebildet werden, wobei mehrere CELs zu Gruppen zusam- 
mengefafit sein konnen; die rait jeweils unterschiedficben, aber vollstandig ausgeflihrten ICRs konfiguriert werden. Dabei 
sind alle CELs in einer Gruppe so verschaltet, daB nach Feststellung einer notwendigen Umkonfigurierung alle gruppier- 5 
ten CELs duich ein gemeinsames Signal (ReConfig) nritgeteilt wind, daB jede CEL die Daienverarbeitung zu beenden 
und in einen umkonfigurierbaren Zustand (iberzugehen hat 

Grundlagen der daedlockfteien Umkonfiguration 

10 

Bei zur Laufzeit nrnkonfigurierbaren Systemen tritt das Problem auf, daB das System in einen Zustand gelangen kann, 
in dem jeweils zwei Teile aufeinander warten und sorait eine klassische Deadlock Situation eingetreten ist 

Dieses Problem konnte venmeden werden, indent eine neue Konfiguration immer nur ganz oder gar nicfat in das Sy- 
stem geladen wird, oder eine Art Hmeout-Verfahreo eingesetzt wird. 

Dadurch entstehen ein Reibe von Nachteilen (benotigter Platz, Laufzeit etc) und Problemen, wie zum Beispiel: is 

- Vorgehen, falls eine Konfiguration nicht. geladen werden kann. 

- VerwaltUDg der Reihenfolge, in der die Konfiguradonen geladen werden 

- Performance Embruch, da andere Konfigurationen, welche eventuell in die CELs geladen wexden konnten, nicht 
beacbtet werden. 20 



Mil dem folgend beschriebenen Verfahren konnen diese Probleme beseitigt werden. Es wird von einem DFP System 
nacb DE 196 51 0755 ausgegangen. 

Von einer CEL aus, wild ein Trigger-Signal, wie in der DE 197 04 728.9 bescbrieben, an eine CT gesendeL Diese CT 
stefit die TViggerquelle fest und wahlt durch eine Look-Up labelle eine zu ladende {Configuration (KR) aus. Die einge- 2$ 
benden Trigg ersignale werden gesperrt, es werden keine weiteren Trigger bis zur kompletten Abarbeitung der aktuellen 
Konfigurafion akztepiert Eine Konfiguration bestebt aus mebreren Befehlen, welche an eine Menge von CELs ubertra- 
gen wird In einem zur Laufzeit konfigurierbaren System ist aUerdings nicht sicbergestelit, daB jeder Koofigurations-Be- 
fenl (KW) auch ausgefUhrt wexden kann. Dies kartn zum Beispiel daran scbeitern, daB das adressieite konfigurierbare 
Element (CEL) seine Aufgabe nocb nicht beendet bat und somit keine neuen Konfiguralionsdaten entgegen nehmen 30 
kann. Um einen Performance Einbiuch zu verbindern, werden alle Konfigurationsbefehle, welche nicht abgearbcitci 
werden konnten , enisprechend eines FIFOs hinter den letzten sicb in einem - nacnf olgend naher bescfarieben - speziellen 
Speicher (HLMO) befin&nden Konfigurationsbefehl geschrteben. Danach wird der nachsten Konfigurationsbefehl, 
nach dem gleichen Vferfabren, abgearbeitet Dies wiedernolt sicb sotange* bis das Ende einer Konfiguration erreicht 
wurde. 55 

Danach geht die CT, wieder in den Zustand iiber, in dem sie Trigger-Sign ale akzeptiert, um eventuell weiter Konfigu- 
rationen zu laden. 

Eine Priorisierung der zu Iadenden Konfigurationen wird erreicht, indem die CT den Speicher HLMO durchlauft, be- 
vor die eigentiich zu ladende Konfiguration bearbeitet wird, Durch eine FIFOShnliche Struktur des FILMO wild sicher- 
gestellt daB KW, welche wShrend vorhergehenden Thggeranfbrderungen nicht vollstandig abgearbeitet werden konn- 40 
ten, automatiscb eine hohere Prioritat vor den neu abzuarbeitenden WK ernalten. Bei der Abarbeitung des Spekbers 
(HLMO) wird jedes durch einen Konfigurationsbefehl adressierte konfigurierbare Element (CEL) zucrst gctestet, ob es 
sicb im Zustand "umkonfiguricrbar" befindet Ist dieser Zustand ''umkonfigurierbar", werden die Daten ubertragen und 
aus dem Speicher FILMO geloscht Ist der Zustand "nicfat umkonfigurierbar*, bleiben die Daten im FILMO und werden 
beim nachsten Durchlauf erneut abgerarbeitet Die CT verarbeitet den nachsten Eintrag im FILMO. Dies wiederboit sicb 45 
solange, bis das Ende des HLMO erreicht ist Danach wird die eigentikbe, durch das Auftreten des Trigger-Signals ak- 
trvierte Konfiguration abgearbeitet Der Anfbau des FTLMOs entspricht dabei dem FIFO Prinzip, das beifit es werden die 
altesten Eintrage zuerst verarbeitet 

Die Qbrigen, nicht beteiligteo konfigurierbaren Bemente arbeitet wabrend dieser Phase parallel weiter und wird nicht 
in ibrex Funktion beeinflufit Dadurch kann der Fall eintreten, daB wShrend die CT den FILMO abarbeitet, eine oder men- so 
rere konfigurierbaren Elements (CELs) in den 7.u<tanA Q umkonfi gurierb ar n ubergeben. Da die CT sicb mil der Abarbei- 
tung an einer beliebigen S telle innerbatb des FTLMOs befinden kann, konnte fotgeoder Fall eintrcten: Die CT versucht 
einen erslen Befehi abzuarbeiten dessen adressiertes konflgurierende Element (CEL) sieb nicht in dem Zustand "umkon- 
figurierbar , • befindeL Die CT fahrt somit mit dem nachsten Befehi (KW) fort Zur selben Zeit gehen em oder mehrere 
konfigurierbaren Elements in den Zustand "umkoimgurierbar" ubej, darunter auch das konfigurierbare Element, welches 55 
durch den ersten Konfigurationsbefehl hatte beschrieben werden konnen. Die CT verarbeitet einen zweiten Konfigurati- 
onsbefehl (KW), welcher das gleiche konfigurierbare Element (CEL) benutzt wie der erste Konfigurationsbefehl, aller- 
dings aus einer anderen Konfiguration stammt Zu diesem Zeitpunkt befindet sicb das konfigurierbare Element (CEL) in 
dem Zustand "umkonfigurierbar" und der Befehi kann erfolgreich abgerarbeitet werden. 

Durch ctiescu Ablauf ist nicht mehr sichergestellt, daB die Konfiguration, welche zuerst geladen werden sollte, auch 60 
tatsacblieh zuerst fertiggestellt wird. Es konnen nun zwei teilweise ferfige Konfigurationen existieren, welche jeweils 
konfigurierbare Elemente der anderen Konfiguration bendtigen, um vollstandig geladen zu werden. Eine klassiche De- 
adlock-Situation ist eingetreten. 

In Fig, 18 ist dieser Zustand dargestellt Konfiguration A und Konfiguration B sollen konfiguriert werden. Die CT hat 
den schraffierten Tfcil von Konfiguration A und Konfiguration B bcreits geladen. Konfiguration A benotigt zur Fertigstel- 65 
lung nocb den hehVdoppelt schraffierten Bereich von Konfiguration B, und Konfiguration B bendtigt zur Fertigstellung 
noch den diinkel-doppelt schraffierten Bereich von Konfiguration A. Da beide Konfigurationen noch nicht vollstandig 
abgeschlossen sind, und somit auch nicht funktionsfShig, tritt fur keine der bei den Konfigurationen der Tenninierungs- 
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zustand ein, in dem cine der beaden Konfiguration en entfemt wiirde. Beide Konfigurationen wsrten darauf, da£ die noch 
benotigten konfigurierbaren Elemente rreigegeben werden. 

In dem vortiegeoden Verfahren wild ein Deadlock verhindert, indem die CT vor der Abarbeitnng des FELMOs die Zu- 
stande alter konfigurierbarer Elemente erfafit und danach bis zur Beendigung des Vbrgangs keine Anderungen mehr zu- 
S lafil, bzw. auftretende Anderungen ignoriert Die CT arbeitet nur auf Basis der erraBten ZusLanden und nicht mit den ak- 
tuelien Zuslanden der konfigurierbaren Elemente. Dadurch isl sicheigestellt, daB jeder zo bearbeitende Befehl (KW) den 
gleichen Zustand der konfigurierbaren Elemente (CELs) vorfindet. Dieser Schritt scblieBt nicht aus, daB ein oder mehrere 
konfigurierbaren Elemente wahrend der Abaibeitung des RLMOs, in den Zustand "umkonfigurierbar* ubergehen. Diese 
Anderung ist fur die CT wahrend der Verarbeitung lediglich nicbt sofort sichtbar, sondern erst zu Beginn des nachsten 
10 Durchlaufs* 

Urn die Broblematik der Umkonfiguration nocbmals zu verdeutlicben wind folgendes Beispiei gegeben: 
Hine Matrix aus CRT * ist unkonfiguriert und im RESET-Zustand. Jede CEL ist in der Lage anzuzeigen, ob sie sicb in ei- 
nem umkonfigurierbaren Zustand befindet. AUe CELs in der Matrix sind Deceit konfiguriert zu werden; befinden sich also 
in einem umkonfigurierbaren Zustand. Bine erste Konfigurationsroutine (KR1) wird ge laden, wobei die Matrix nicht 
15 vollstandig benutzt wird Die konfiguriertea CELs heben die Anzeige, daB sie sicb in einem konfigurierbaren Zustand be- 
finden auf. In einen Teil der noch nicht konfiguriertea CELs wird eine zweite, von der Ersten unabhangigen, Konfigura- 
tionsroutine (KR2) geladen. Bine dritte Konfiguration kann nicht ge laden werden, da diese CELs der ersten und/oder 
zweiten Konfigurationsroutine (KR3) benStigt, die sich aber in keinem umkonfigurierbaren Zustand befinden, da sie be- 
nutzt Werden. 

20 KR3 mufi so lange angehalten werden, bis die benotigten CEL freigegeben wurden, <L b. KR1 und KR2 terminiert ha- 
ben. Wahrend der Ausfuhrung von KR1 und KR2 kommt eine Ladeanfordening fur eine vierte Konfigurationsroutine 
(KR4) und erne funrte Konfigurationsroutiiie (KRS) himrif, die alle nicht sofort geladen werden konneu, da sie CELs be- 
nutzen, die von KR1 und KR2 verwendet werden. KR3 und KR4 benutzen teirweise die seiben CELs, KR5 benutzt keine 
der CELs von KR3 und KR4. 

25 Urn KR3-5 ordentlich nachzuladen existieren folgende Forderungen: 

1 . KR3-5 sollen so geladen werden, dafi die zeitlicbe Reihenfolge gemSB den Ladeanf orderungen mdglicbst beibe- 
haltenwird 

2. Moghchst viele KR die unabhangig von einander sind also keine gemrinsamen CELs besitzen, sollen geladen 
30 werden, um ein HochstmaB an Parallelitat zu erhalten. 

3. Die KRs durfen sicb nicht gegenseitig bloclderen, d h. KR3 isl leitweise geladen, kann jedocb nicht weitcr ge- 
laden werdfirx, da andere CELs durch die teilweise geladene KR4 blocjdert sind; wfcbrend KR4 aucb nicbt weiter ge- 
laden werden kann, da wiederum benotigte CELs durcfa KR3 blockiert sind Dies fuhrt zu einer typiscfae Deadlock- 
Situation. 

35 4. Dem Compiler, der die KRs generiert hat ist es nichi moglich das zeitliche Zusammenspiel der KRs zu erkennen 
und so aufzulosen, dafi es zu keiner Konfliklsituadon kommt 

Dabei soil das Verbaltnis zwiscben den Aufwand fiir eine zu reahsiereode Schaltung und eines optimalen Ergebnisses 
moghchst gut sein, d h. Ziel der Erfindung ist es mit moglichst geringem Aufwand eine flexible, parallel Daedlock- 
40 freie Konfiguration zu ermSglichen, die mit wenig Zeh- und Rechenaufwand durchgefiihrt werden kann. Dabei musseo 
folgende Grundprobleme geldst werden: 

- Wurde nur KR3 geladen werden, wife das %rfahren Daedlock-frei, doch nicht optimal, da auch KRS geladen 
werden konnte. 

45 - Wird KR3 geladen, KR4 nicht, jedocb KRS muB KR4 so vorgemerkl werden, dafi es bei einem nachfolgenden 
Lade vorgang die hcchste Prioiitat besitzt, was einen bohen VerwaUungsaufwand bedeutet 

Zur Lfisung dieser und der Eingangs genannten Aufgaben dient die vorliegende Erfindung: 

50 CACHE-PRttdP 

Die CT-Struktur ist Werarcrriscb aufgebaut, dh.es existferen in einem Baustein mehrere CT-Ebenen. Die Anoidnung 
entspricht vorzugsweise einer Bauznstruktur (CT-Ttee). Dabei ist der Wurzel-CT (Root-CT) der exteme Konfiguranons- 
speicher (ECR) zugeordnet, wahrend den Blattcm die konfigurierbaren Elemente (CELs) zugeordnet sind. Den Cft der 
55 mittleren Ebenen sind jeweils die konfigurierbaren Elemente zugeordnet, die sich auf derselben Hieraichiestufe befin- 
den. 

Jeder CT ist ein k>kaler intemer Speicher zugeordnet. Dieser Speicher wird nur geloscht, werm neu zu speichernde 
KRs keinen Platz mehr baben. Dabei erf olgt das Loscheo KR-weise, anhand einer Loscbstrategie, so dafi bestenf alls nur 
die KR geloscht werden, die nicht mehr angef ordert werden. EbenraDs werden die KR einzeln geloscht, nur genau so 

60 viele, daB genau so viel Speicher freiist,wie notwendig ist um die ncu zu ladende KR in den Speicher zu schreibeo. Da- 
durch wird erreicht, daB moglichst viele KR in dem Speicher verbleiben. 

Der Vbiteil liegt darin, daB jede, einer beliebigen CTx imtergordente CT, die sich also weiter oberhalb im CT-Baum 
befindet eine KR, die in der CTx gespeichert ist nicht von dem extemen Konfigurationsspekber ECR anfordert, sondern 
direkt von CTx erhalt. Dadurch ergibt sich eine Cacbestruktur fiber mehrere Ebenen. Dadurch wird der tibertragungsauf- 

65 wand im CT-Baum und ins besondere die benotigte Spcicherbartdbreite des ECR erheblich gesenkt. Auf Basis dieser 
Struktur ergeben sich auch mogliche Loschstrategien, die allerdings je nach Anwendung empirisch festgelegt werden 
sollten. Eine Moglichkeiten sind: 
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- Loschen des Sltesten Eintrage 

- Loschen der (deinsten Bntrfige 

- Loschen der groflten Eintrage 

- Loschen der am seltensten abgerufenen Eintrage. 



Der Grundarrfbau eioer CT 

Die nachfolgende Obersicht (ibex die CT gibt einen OberbKck uber die einzelnen Baugruppen. Die detailierte Be- 
schreibung der Baugruppen wird im Folgenden gegeben. 10 

Kern einer CT ist die Stojer-Statemacbine (CTS) die samtliche Abarbeitungen von Konfiguxatipnsroutinen (KRs) 
steuert. Der CTS zugeordnet ist, der Garbage-Koliektor (GQ, der das Entfemen von KR aus dem 8 peicher (CTR) der CT 
sleuert; das FTLMO, das die Verwaltung der noch abzuarbeitenden KWs ubenximmt und die LOAD-Statemachine, die 
das Laden von KRs steuert 

Der Speicher (CTR) ist als gewohoKcber Schreib-Lese-Speicher ausgestaiiet, wobei alle techniscb mdglkhen Impk- 15 
mentierungen zum Einsatz kommen konnen, und wird zur lokalen Speicherung von KRs fur die jeweilige CT und deren 
untergeordnete CIV verwendet Als Sonderfal] kano der Spekber (CTR) auch als ROM, EEROM, EEPROM, Flash- 
ROM o. a\ ausgestaiiet sein, urn den Baustein mit einer res tea, ASTC Oder PLD-Shn lichen (siehe Stand der lecbnik) 
Funkdon zu verseben. 

Zur Generierung der CFR~Adressen werden vier als ladbare Zahler ausgestaltete Pointer verwendet 20 

1. Free-Pointer (FP): Zeigt anf den ersten freien Speicherpiatz hinter der letzte KR im CTR, 

2. Garbage-Pointer (GP): Zeigt auf einen dutch den Garbage-KoUektor (GQ zu entfexnenden Hntrag aus dem 
CTR. 

3. Move-Pointer (MP): Zeigt auf eine Speicherstelle im CTR, von der ein gOlliges, rricht zu entfernendes Kon figu- 25 
radonswort (KW), also einen Hntrag eines KR, an den durch GPdcfiniertcn Eintrag kopiert/bewegt wird. 

4. Program-Pointer (FP): Zeigt auf das momeutan von der CTS ausgefuhrten KW. 

KW werden Qber ein Ausgabe-Interfaoe (OUT) an die zngehorenden CELs weitergegeben. Die CELs quittieren, so- 
fern sie sich in einem umkonfigurierbaren Zustand befinden den Empfang der KW. Wird ein KW nicbt quittiert, wird es 30 
in einem HFO-ahnlichen Speicher (FILMO), zeitweise zwi sebengespdehert, urn zu einem spateren Zeitpunkt, ohne den 
Program-Pointer zu benutzen, emeut an die adressierte CEL geschrieben zu werden. 

Eine Aufforderuog zur Abarbeitung eines KR erbfilt die CTS durch Triggersignate Die Triggersignale durchlanfen 
eine Maske, das ist ein Filter, der unerwunschte Trigger ansfUlert (ausmaskiert). Eine Maske kann nach dem Stand der 
Technik durch UND-Gatter (AND) aufgebaut werden, die einen Trigger mit einem Freigabe-Signal UND-verknupfL Die 35 
Trigger werden aber einen prtorisierten Round-Robin- Arbiter (SCRR-ARB) in Binarsignale nmgewandelL Ein priori- 
sicrter Round-Robin-Arbiter verknupft den Vorteil der Gleichberechdgung eines Round-Robin-Arbitcrs mil der Erken- 
oung der nachsten Freigabe in einem lakt, also dem Vorteil eines Priori tats- Arbiter; 

Die maskierteo Trigger werden als Adresse auf eine erste Lookup-TabeUe (LUT1) geschaltet das ist ein Speicher, der 
dem als Adresse eingehenden Trigger das ID der betreffenden KR zuordnet und auf den Datenleitungen ausgibL 40 

In einer zweiten Lookup-TabeUe (LUT2) wird die ID der KR der Adresse des Spekherplatzes der KR im CTR zuge- 
ordnet Die zwcite Lookup-labelle wird nicht nur zur Zuordnung von Trigger-Signalen verwendet, vielmehr benutzen ei- 
nige Befehle, die einen ID als Parameter verweodco die LUT2 ebenfalls zur Adresszuordnung. 

Die Zuordnung der Trigger-Signals zu den betrefrenden IDs wird Qber den nachfblgend beschnebenen Berehl "REFE- 
RENCE" in die LUT1 eingeiragen. Die 'verwaltung der LUT2, also die Zuordnung der IDs zu den Adressen im CTR, ge- 45 
schieht automatisch durch die CTS und den GC. 

Zumbesseren Verstandnis der CT ist im Folgenden ein moglicher Grundbefehlssatz dargestellt: 

1. BEGIN <ID> 

50 

Durch BEGIN <ID> wird der Anfang einer KonfiguraiionsroutiDe gekermzeichnet <ID> gibt die eindeutige Identifi- 
kationsnummer der Korifigujratjonsroutme an, 

2. STOP 

55 

Durch STOP wird das Ende einer Konn^umdoosroutine gekennzeichnet An dieser Stelle beendet die Konfiguranons- 
tabelle (CT) die Abarbeitung der Konfigurationsroutine. Der Garbage-KoUektor (GQ beendet das Entfemen von Eintrfi- 
gen dieser Konfignration&routinc. 

3. EXECUTE <ED> 60 

Spring! zum fieginn (BEGIN <ID>) einer Konfi gurationsroutine. Ist diesc Routine nicht im Speicher der CT vorhan- 
den, so wird sie von der daruberiiegenden CT angefordert, bzw. aus dem Speicher geladen. 

4.LOAD<ID> 65 

Fordert die KR <ID> von der daruberliegenden CT an. 
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2.BOOT<CT-ID> 

BOOT <CT-ID> kennzeichnet io welche CT die nachfolgende Boot-KR geschrieben werden soil. Nach BOOT <CT- 
ID> folgl kein BEGIN, die Boot-KR wird nicht durcfa STOP, sondern durch ein nacbfolgeodes BOOT <CT-ID> abge- 
schlossen. Ein STOP beendet den Bootvorgang. 

BOOT <CT-ID> darf nicht innerhaib eines Programmes auftreten. 



BooL-\fargang 

Nach eincm RESET ladt die CT dcs obersten Hierarchic-Levels (ROOT-CT) die Boot-KR in die CIs der unteren Hier- 10 
archien. Dazu existiert ein Sprung an eine festgeiegte Adresse (BOOT-ADR) im, der ROOT-CT zugeordneten, externen 
Konfiguralionsspeicher (ECR). Die ROOT-CT fiihrt diesen Sprang durch und eneicht die Boot-Sequenz. Diese ist wie 
folgl aufgebaut: 

BOOT <CT-ID0>; COMMAND; COMMAND; . . . 

BOOT <CT-ID1>; COMMAND; COMMAND; ... 15 

BOOT <CT-IDn>; COMMAND; COMMAND; . . . 
STOP; 

Wahrend des Boot-Vbrganges wird zunSchst die komplette Boot-KR in das CTR ab Adresse 2 der durch <CT-ID> an- 
gegebenen CT geschrieben. Die Beginnsequenz des Boot-KR (BEGIN <0>) wird nicht auf Adresse 1 geschrieben. An 20 
dessen Stelle steht WATT-FOR-BOOT, das bei einem RESET automatisch gesetzt wird. Erst nachdern die gesamte Boot- 
KR in das CTR geschrieben ist, und die ROOT-CT das nflchste BOOT <CT-ID> eneicht hat, wild STOP an das Bode des 
Boot-KR in das CTR geschrieben und WATT.FOR JBOOT mit BEGIN <0> Oberschriebert Die CTS beginnt mit der Ab- 
arbeining der Boot-KR. 

25 

Laden einer Konfigurationsroutine 



Es existierem drei Guridmechanismen urn eine Konrlgurationsroutine, aufier der Boot-KR anzufordern: 

1. Ausfuhren eines LOAD <ID> durch die CTS 30 

2. Ausfuhren eines EXECUTE <H>> durch die CTS, wobei <fie KR mit der betreffenden ID nichi i m CTR vorhan- 
den ist. 

3. Auftreten eines Triggers, der uber die LUT1 auf eineu <SD> ubersetzt wind, dessen zugeborige KR rricht im CTR 
vorhanden isL 

Der Ablauf in alien drei Fallen istderselbe: 
Die ID der angeforderten KR wird der LTJT2 als Adresse angegeberu We LUT2 Qberpriift, oh eine gultigc Adresse im 
CTR existiert Existiert diese nicht, <L h. <ID> zeigt in der LUT2 auf den Wert 0, wird load <ID> an die CTS gesendet 

Die CTS fordert daraufhin die <ID> betreffende KR bei der bierarchisch Ubergeordneten CT an. Diese Anforderung 
eneicht die uTjergeordnete CT in Form eines Triggers und wird entsprechend von ihr ausgewertet 40 

Die ubergeordnete CT sendet die angefbrderte KR an die anfordemde CT. Die Daten werden ab der Adresse, auf die 
der FREE-POINTER (FP) rcigt in das CTR geschrieben, wobei der FP nach jedem SchreibzugrirT urn eins erhoht wild. 
Errocbt der FP die obere Grenze des CTR, wird der Garbagc-Kollekcor (GQ aufgerufen, urn die untexste KR innerhaib 
des CTR zu enrfernen und das CTO. zu konnximieren- Der FP wird dabei neu gesetzt Dieser Vbrgang findet so lange 
start, bis die zu ladende KR komplett in das CTR pafit 45 

Sprungtabelle im Konfiguratknsspekher 

Der der ROOT-CT zngeordnete Konfigurationsspeicher beinhaltel samtliche KR, die fur eine Application geladen 
werden mussen. Im externen Konflgurationsspedchers CECR) befindet sich an einer festgekgten Adresse (ADR-BOCT) 50 
Sprung zu der Boot-Konfigurations-Routine. In einem weiteren festgelegten Speicherbereich (L171-ECR) beliebiger, je- 
doch fest vorgegebener Lange die Sprfinge zu den einzelnen KRs. Dabei wird die <ID> der jeweiligen KR als Adresse im 
ECR verwendet, an der die Startadresse der jeweiligen KR steht; wodurch KRs indirekt adressiert werden: 

ID-* LUT-ECR — ► KR 55 



Anderung der KR im Konfigtirationsspeicher 

Die KR mit der ID <A> soli geandert werden, ZunSchst schreibt der HOST die neue KR fur die ID <A> an eine freie 
Speichcrstcilc im ECR Die ID <A> wird zusammen mit der neoen Adresse der KR im Konfigurauonsspeicher von der 60 
fibergeordneten Einheit (HOCS T) in ein daftlr vorgesehenes Register der ROOT-CT geschrieben. Die ROOT-CT sendet an 
alle darunteriiegenden CIs das Kommando REMOVE <A>. Daranmin entfernen alle CIs beim Erreichen eines STOP 
oder wahrend IDLR-Zyklen, also sobald keine KR ausgefuhrt wind, die auf diese ID bezogene KR aus dem CTR und set- 
zen die LUT2 an Adresse <A> anf "NoAdr*\ das bedeutet, es existiert keine gttliiger Adresseintrag fur ID <A> in LUT2. 
Wird die ID <A> erneut angefordcrt, zwingt der fehlende Eintrag ("NoAdr") an Stelle <A> in die LUT2 jede CT die KR 65 
<A> vora ECR neu anziifordern. 
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5. REMOVE <ID> 

Ruft dec GC auf, urn die Konfigurationsroutine <ID> von BEGIN <ID> bis STOP aus dem Speicbex der CT zu eut- 
feroen und die nacbfolgenden Konfigurationsroutinen so weit vorzuschieben, dafi kein Srjefeberloch durch die entfemte 
5 Konfiguradonsroutine entsteht. 

6. PUSH <FORCED> <ADDRESS> <DATA> 

Schreibt die Konngurationsdaten <DATA> an das Register <ADDRESS>. 1st <FORCED> gesetzt, werdeo die Daten 
10 aucb geschrieben, wenn das RECONFIG-Flag des betreffenden Zielregisters mcbt gesetzt ist 

7. MASK <SR> <TRIGGER> 

Setzl die Irigger-Maske mil <TRIGGER>, bzw. setzt sie nnt <TRIGGER> zuriick, abbangig von <SR> (Set/Reset) 

15 

8. WAIT <UNMASCKLD> <TRIGGER> 

Halt die Abarbeitung der Konfigurationsrcmtine an und wartet auf den Trigger <TRIGGER>. Ist <UNMASCELD> ge- 
setzt, wild auf das erwartele Trigger unabhangig des Zustandes der THgger-Maske neagierL 

20 

9, TRIGGER <TRIGGER> 
Seodet den Binirwert eines Triggers an die ubergeordnete CT. 
25 10. REFERENCE <TRIGGER><TD> 

Schreibt in die LUT1 bei Adresse <TRIGGER> den Wert <Kfr t wodurch eioem Triggersignal eine besrirnmre KR zo- 
geordnet wild. 

Die Befehle EXECUTE, LOAD, REMOVE, PUSH, MASK, WATT, TRIGGER, REFERENCE sind nurinnerhaib der 
30 Klammer BEGIN . . . STOP gultig. AuBerhalb dieser Klammer werdeo die Befehle nicht ausgefuhrL 

Der Aufbau einer Konfiguranonsroudne (KR) sieht wie folgt aus: 
BEGIN <ID>; 

gtiltige Befehle 
35 ... 

STOP; 

Indirekte Addressienmg (Rererenzierung) 

40 Das Cacbe-Prinzip der CT ermdglicht das Zwiscberispeicbeni einer KR in einer CX wobei die KR von mebreren un- 

terschiedhcheii tieferliegenden Cft Oder CELs genuizt werden. 
Werden von den tieferHegcnden Einheiten Zugriffe auf das externe Interface des Bausteines (z. B. RAM, Peripherie) 

dnrchgeflihrt, ezgibt sich die Notwendigkeit unterscniedKche Adressen oder Teile des exteroen Interfaces zu spejebern. 

Dadurch wurde sich der Inbalt der einzeineo bendtigten KRs grundlegend unterscneiden. Ein Caching ist nicht mehr 
45 mogfich. 

Abhilfe schafft eine indirekte Referenziening. Dazu werden spezieUe KR (im folgenden KR genannt) verwendet, die 
die Dotwendigeo externen Paramter bdnbalten und setzen. EventueU werden tiber Trigger andere unterschiedliche KRs 
in verschiedenen Hierarchieebenen aufgerufen. Ab Ende einer IKR wird das eigendichc KR aufrufen. Lediglich die IKR 
sind nicht cacbebar, wanrend die aufgerufeoen KR durchaus einheitlich und daher cachebar sind. Es ist sinnvoll, die 
50 GroSe der IKR auf das absolute Minimum zu reduzteren, natnlich ausschUeSlkh die externen und unterscbiedlichen Pa* 
rameter und den Aufiuf der einbeitlicben KR. Eine indirekte Konfigurationsroutine (IKR) ist wie folgt aufgebaut: 
BEGIN <TD>; 

xxx; gtiltige Befehle, wobei lediglich externe Peripherie angesteuert werden sollte, 
55 TRIGGER <ID>; Start-, Stop- oder Lade-AnfoideruDgen an Periphere Prozesse 

GOTO <H)>; Sprung zur einbeitlichen KR STOP; 

SondeifaBe 

60 l.WAIT_FOR_JBOOT 

Dieses Kornmando ist nur an der ersten Adresse des CTR gultig. Wahrend des Boot-\brganges wird zunaehst die 
komplette Boot-KR in das CTR geschrieben, jedoch nicht die Beginnsequenz des Boot-KR BEGIN <G>. Ao dessen 
65 S telle (auf Adresse 1) steht WATT-FOR-BOOT, das bei einem RESET automatisch gesetzt wird Em nachdern die ge- 
samte Boot-KR in das CTR. geschrieben ist, wird WAIT_FOR_BOOT mit BEGIN <0> uberschrieben und die CIS be- 
ginnt mit der Abarbeitung der Boot-KR. 

WA1TJORJBOOT darf nicht innerhalb eines Programmes auflreteiL 
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DasFELMO 

Ein KR besteht hauptsachHcb aus dem Befehl PUSH, der neue Konfigurarionsworte an eine besiimmtc Adressc 
schreibt. 1st das Schreiben eines Konfigurationswortes nicht moglich, da das adressierte konfigmierbare Element (CEL) 
5 nicht bereit ist eine neue Konfiguratioo zu empfangen, wild das KonfiguraUonswort statt an das adressierte konfigurier- 
barc Element (CEL) in einen Speicher, im folgenden FILMO genannt, geschrieben. Die nachfolgenden Befehle werdeo 
normal abgearbeitet, bis emeut ein Konfigucationswort nicht geschrieben warden kann, das dann in das FILMO geschrie- 
ben wird. 

Das FILMO wird in IDLE-Zyklen und vor jedem Ausftihreo eines nenen KR komplett durchlaufen. Dabei wird, be- 
lt) gionend beim altesten Datenwort, entsprechend eines FIFOs nach dem Stand der Tbchnik, jedes ausgelesene Wort des 
FILMOs an sein adzessiertes Element zu senden; dabei mufi das adressierte Element bereit sein das Konfigurationswart 
zu empfangen. Sofem die Datenworter von Beginn an geschrieben werden konnen ( d. h. die adiessierteo konfigurierba* 
ren Elemcntc (CELs) sind bereit) wird der Eintrag aus dem FILMO nach Art eines FIFOs entferaL Kann ein Konfigu- 
raiionswort nicbt geschrieben werden, wird es iibersprungen und nicht aus dem FILMO entfernt. Im Gegensatz zu einem 
15 FIFO werden die Daten nacb dem ubersprungenen Konfiguraiionswort weiier ausgelesen. Konfiguradonsworte^ die nach 
einem ubersprungenen Konfigurationswort geschrieben werden konnen werden entweder je nach Implement! emng des 
FILMOs 

1. als geschrieben markiert und nicht aus dem FILMO gelSscht, wobei als geschrieben markierte Kon figuration s- 
20 wditer bei den folgenden Durchlaufen nicht mehr gelesen werdeo, bzw. sofort geldscht werden, sofem kein uber- 

sprungenes Konfiguraiionswort mehr vor ihnen Hegt; odcr 

2. aus dem FILMO geloscht, wobei die Konfiguralionsworter vor und nacb dem geldschten Konfiguraiionswort er- 
halten bleiben, dabei musseo zum Loschen die nachfolgenden Worte nach vorne (obeo) oder die davorliegenden 
Worte nach hinten (unten) geschoben werden, wobei die Reibenfolge der Konfigurationsworte unbedingt beibebal- 

25 ten wird. 

Wird eine neue KR ausgefuhrt, werden die Konfigurationsworte (KW), die von der CTS nicht an die adressierten Eie- 
mcntc (CELs) geschrieben werden konnten, emeut an das FILMO angehftigt, d b. die KW werden an das Ende (aus Le- 
serichtung) des FILMOs geschrieben. 1st das FILMO volU cLh.es existicren keine freien Eintrage fur Konfiguradons- 
30 worte, wird die Ausfiihrung des KR gestoppt Das FILMO wird so lange durchlaufen, bis genugend Konfigurationsworte 
geschrieben werden konnten und entspiechend viele frdc Eintrage cntstanden sind, woraufhin das KR welter abgearbei- 
tet wird 

Das FILMO stellt einen FIH>Shnlichen Speicher dar, der immer vom altesten Eintrag an linear durchlaufen wird, im 
Gegensatz zu einem FIFO werden jedoch Eintrage fibers prungen (First In linear Multiple Out) 

35 

Die Funktion der Konfiguration stabellen-StatBinachine (CTS) 

Die KonfigurationstabdlechStatemachine (CTS) uT>emimmt die Steuerung der CT Dabei fuhrt sie die Befehle der KR 
aus und reagiert auf eingehende Trigger. Sie uberninunt die Verwaltung des FILMOs, Lb. best sie in IDLE-Zyklen und 
40 vor dem Ausfuhren einer KR das FILMO aus. 

Sie reagiert auf die von der LUT-Struktar generierten Signalen illegal <ED> (Illegal Trigger, siehe Fig. 1, 0102) und 
load <ID>. load <ID> wird generiert, wenn ein Cache-Miss in LUT2 vorfiegt (0105), oder die durch ID rcfcienzicrte KR/ 
IKR als geloscht markiert wurde (0107) Sie reagiert auf die Steuersignale der Qbergeordneten CT. Ein Implementarions- 
betspicl fur die Verarbeitung der Befehle ist in den Fig. 2 bis 7 dargestellt 

45 

Steuersignale an ubergeoxdnete CIS 

illegal<ID> (0102) 
load <H>> (0105/0107) 
50 trigger <trigger> (0108) 

Steuersignale von Qbergeordneten CTs 

remove <□>> (siehe Fig. 15, 1513) 
55 write_to_FP <data> (siebe Fig. 2, 0205). 

Die Funkrioo des Garbage-Koflektors (GO 
Der CTR unterliegt zwei Problemen: 

60 

1 . Verweist ein LOAD- oder EXECUTB-Befehls, bzw, ein Trigger, auf eine ID, deren KR nicbt im CTR vorhanden 
ist, mu6 die KR nachgeladen werden. U.U. ist jedoch nicbt genugend Flatz im CTR vorhanden urn die angeforderte 
KR zu laden. 

2. Beim Auftreten ernes REMOVE <ID> ist die entsprechende KR aus dem CTR zu entferneo. Dabei entsteht, so- 
65 fem sich dike KR nicht am Ende des CTR befindet eine Lucke. Beim Laden einer neuen KR wird die Lucke u. U. 

nicht wieder ganz aufgefUUt oder die Lucke ist zu klein fur die neue KR. Dies fUhrt zu einer Fragmentierung des 
CTR. Die Aufgabe des Garbage-Kollektor ist es, KR aus dem CTR zu eotfemen, um Platz filr neue Entrage zu 
schaffen UND nach Entfernen der Eintrage den CTR so umzuorganisieren, daB alle verbleibeoden KR als geschlos- 
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sener Block hintereinander im Speicher ttegen und die freigewordenen Speicherbldcke als ein gescblossener Block 
an einem Ende des CTR liegen. Dadurch konnen auf optimale Vfeise und ohne Verluste an Speicherplafz neue KR 
aachgeladen werden. 

5 

Auswerten von Thggerimpulsen 

Jedc CTbesitzt einen AnschluB an mehrere zu ihrer jeweiligen Hierarchieebene gehorcnden Triggersignalc, die rxx ei- 
nem Bus zusarnmengefaBt and Eingehende Trigger werden tlbereine Maske ausgewertet d. b. nur die rreigeschalteten 
Triggersignale weiden weitergeleitet Die freigeschaltelen Triggersignale werden taktsynchnon in einem Sample-Regi- 10 
ster zwischen gespeichert (gesampled). Ein Round-Robin- Arbiter wahlt ohne Priori till eines der gespeicherten Triggersi- 
gnale aus und wandett das Signal in einen bioaren Vektor. Das gewahlte Triggers ignaJ wild aus den Sample-Register ge- 
ldscbt Der Binarvektor wird an erne erste Lookup-Tabelle (LUTl) weitergeleitet, die den Binarvektor in die Identifika- 
lionsnummer (ID) der aufzurufenden Konfigurationsroutine (KR) iibersetzt Die ID wird in einer zweiten Lookup-TV 
belle (LUT2) in die Adresse der KR im CT-Speicher (CTR) ubersetzL Die CT-Statemachine (CTS) selzt ihren Pro- 15 
gramm-Pointer (PP) auf diese Adresse und beginnt nrit der Ausfuhrung der KR. VbraussetzuDg ist, daB jeder uber die 
Maske rrei geschaltete Trigger einen entsprecheuden Eintrag in LUTl besitzt Fehlt dieser, wird ein Fehlerzustand an die 
CTS weitergeleitet (illegal trigger), dabei wird jede ID « "NoAdr" als nicht vorbandener Eintrag gewertet "NoAdr" ist 
ein irnpleraentationsabharjgig gewanltes Token. 

Fehlt der Eintrag in LUT2, d h. die auf die ID bezogene KR befindet sich nicht im CTR, wird eine Ladeanfbrderung 20 
an die CTS gesendet Goad <ID>). 

Senden von Triggerimpulsen an die Ubergeordnete CT Neben der bereits beschriebenen Schnitt s telle zo einer fiberge- 
ordnerten CT zum Laden von KR existiert eine weitcre Scbmttstelle zum Austauschen von Triggecsignalen. Dabei sender 
eineCT 

25 

1. an alle anderan CTs einen Triggervektor (BROADCAST) 
Z an die darQberliegende CT eineo TViggervektor (HIGHER) 

3. an die darunterliegende CT einen TViggervektor (LOWER) 

4. an eine beliebige adressierte CT einen Triggervektor (ADDRESSED) 

30 

Wobei ein Triggervektor einen Binarwert darstelll, der auf einen Eintrag in der LUT2 der empfangenden CT referen- 
ziert Der Mechanismus ist notweodig mn beispielsweise irmerhalb einer IKR eine KR in einer weitereo CT zu starten um 
beispiebrweise die Peripherie oder den Speicher anzusteuern. 

Zur Weitedeitung von Triggersignalen an eine ubergeordnete CT exisueren 2 Mecbanismen; 

35 

1. Der LUTl wird ein Bit Mnzugefugt, das angibt, ob der Inhatt des Speichers als KR ID oder als Binarwert fiir ei- 
nen Triggerimpuls betrachtet wird Iiegt ein Triggerimpuls vor, wird der Datemnhalt von LUTl direkt als Trigger 
an die ilbergeordnete CT gesendet 

2. Mit dem Befehl TRIGGER kann der Binarwert eines Triggers angegeben werden, der cfirekt an die ubergeord- 
nete CT gesendet wird 40 



Der priorisierte Round-Robin- Arbiter 

Der priorisierte Round-Robin- Arbi ler (Single-Cycle-Round-Robin-Arbiter SCRR-ARB) ist taklsynchion aufgebaut, 45 
d. h. bei jeder -je nach Implementierung positiven oder negatives - TakuT anke (TF1) Hefert er ein Ergebnis. Die einge- 
henden Signale (ARB-IN) durchlaufen eine Maske (ARB-MASK), die von dem Arbiter gemSB dem nachfolgend be- 
schriebenen Verfahren selbst verwaltet wird Die AusgBngssignale der Maske werden an einen Priori tatsarbiter nach dem 
Stand der Technik geleitet Der Arbiter hefert taktsynchron bei jeder Taktflanke (TF1) ein Ergebnis (ARB-OUT), d b. 
den Binarwert des hochstpriorisierten Signals nach der Maske (ARB-MASK). Dem Ergebnis zugeordnet ist ein Signal 50 
(VALID), das angfbt, ob der Binarwert gultig oder nngulhg ist Abhangig von der Impiementierung der Priorftatsarbiters 
ist es mfiglich, daB beam Anliegen des Signals 0 und beim Anliegen keines Signals derselbe Binarwert generiert wird: In 
diesem Fall zeigt VALID an, dafi das Ergebnis ungtlltig ist, sofern kein Signal anHegt Dieses Signal wird 

1. als Ergebnis der Arbiters ausgegeben und ss 
2 auf einen Dekoder geschaltet, der die Binarwerte ~ wie in der folgenden Tabelle bekpielsweise fiir einen 3-bit 
Binarwert angeben - auskodiert (Das Komerungsvertabren ist gemSB dieses Prinzips auf jeden beliebigen Binar- 
wert anpaBbar): 



65 
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Binarwert 
(ARB-OUT) 


Auskodierung 
(ARB-DEC) 


Bemerkung 


111 


0111 1111 




110 


0011 1111 




101 


0001 1111 




100 


0000 1111 




Oil 


0000 0111 




010 


0000 0011 




001 


0000 0001 




000 


1111 1111 


Reset-Zustand und 

wertn Binarwert (ARB-OUT) ungtkltig 



Bern Dekoder zugeordnet ist ein Register (ARB-REG), das die auskodierten Werte (ARB-DEC) des Decoders bei der 
zu TF1 inversen Taktflanke (TF2) fibemimmL ARB-DEC wild aaf die Maske (ARB-MASK) znruckgekoppett und 
25 scfaallet die einzelnen Eingangssignak (ARB- IN) frei. 
Der ftmktionale Ablauf im Arbiter ist wie folgu 

1. Nacn einem RESET sind alle ARB-IN uber ARB-MASK freigeschaUet, da ARB-DEC alle Signale auf "Frei* 
gabe* steUL 

30 2. Das hochst priorisierte gesetzte ARB-IN (beispielsweise besitzt in der obi gen Tabelle das Signal 7 (binar 111) 
die hocbste Prioritat und 0 (binar 000) die mederetc Prioritat) wird als Binarwerl ausgegeben. 

3. Uber ARB-DEC wird das Signal gesperrt, sowie alle weiteren Eingange die evtL noch hdher priorisiert waren, 
aber nicfat gesetzt sind 

4. Die foigenden Scbxitte 5 und 6 wiederhokn sich so lange, bis das Signal 0 (binar 000) erreicnt ist, oder kein Si- 
35 gnal hinter ARB-MASK mehr anliegt Dann schaltet ARB-DEC (siehe AuskodierungstabeUe) wieder alle Sign ale 

durch ARB-MASK Ober ARB-DEC frei und der Ablauf beginnt bei Schritt 2. 

5. Das nunmehr hochst priorisierte gesetzte ARB-IN wird als Binarwerl ausgegeben. 

6. Uber ARB-DEC wird das Signal gespent, sowie alle weiteren Eingange die evtL noch hdher priorisiert waren, 
aber nicht gesetzt sind. (Welter mit Schritt 4). 

40 

Dadurcb wird erreicht, daB alle Hngangssignale gLekhberecbtigt behandelt werden und bei jedem Takizyklus elites 
derEingangssignale (ARB-IN) binar aus kodiert und ausgegeben (ARB-OI7T) wird 

ARB-REG kann mit einem Enablc-Eingang (EN) versehen werden, der eine Anderung des Registerinhaltes nur bei 
TF2 zulaBt, weim ein entsprechendes Signal anliegL Dadurcb wird nicht bei jedem Takt ein Binarvektor ausgegeben, 
45 sondem abhangig von einer Freaschaltung durch EN und TF2. Der Eingang wird zur Synchronisation notwendig, wenn 
die nachgeordnete Schaltung die Verarbeitung nicht in einem laktzyklus durchfuhren kann, sondem mehrere Zyklen be- 
nfctigt und erst dann den nacbsten Binarvektor akzepdert 

Figuzen 

50 

Die nacnfblgend beschriebenen Figuren verdeudichen anhand eines Implementationsbeispiels die Verwaltung von 
Konfigurauonsdaten nach dem vorgesteHten Verfahren: 

Fig. 1 Yerrahieu der Adressgenerierung innerhalb der Lookup-Tabellen 

Fig, 2r-7 Abarbeitung der Befeble und Funktion der Statemachinen 
55 Fig- & Aufbau des SCRR-ARB 

Fig. 9 Aufbau derLUTl & LUT2 

Fig. 10 Aufbau der Poinrerarithmetik und des CTR 

Fig. 11 Aufbau eines FELMO 

Fig. 12a Kerarchiscbe Anordnung der CIs 
60 Fig. 12b Senden eines Triggers zwiscben den CTs 

Fig. 12c, d Metboden zum Senden eines 

Fig. 13 Aufruf einer KR durch mehrere IKR 

Fig. 14 Aufbau der LUT1 einer ROOT-CT 

Fig. 15 Aufbau der HOST-Steuerung einer ROOT-CT 
65 Fig. 1 6 Vcrdeutuchung des LUT und ECR Konzeptes 

Fig. 17 Ablaufstcuerung einer CT mittlerer Hierarchieebene, bzw. einer ROOT-CT 

Fig. 18 Deadk>ckproblematik bei der Konfiguration eines 2-dimensionalen Arrays 

Fig. 19 Verdeudichung des FILMO-Konzeptes 
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BeschreAbung der Figuren 

Pfe. 1 zeigt den Ablauf der CTR-Abxessgeoerierung innerhaib einer CT. Dabei wild ein eingehender binarer Trigger- 
vektor (0101) in der LUTl auf eine gttltige KR oder IKR ID ubersetzt Existieit keine gUltige ID, wind ein Signal "Illegal 
Trigger" generiert (0102), das anzeigt daB der Trigger nicht in LUT1 bekannt ist Das Signal kann als Feblenueldung an 5 
die ubergeordnete CT weitergeleitet oder ignoriert werdea Die Obersetzung von "Trigger" nach "TO" wird mittels des 
Befehls "REFERENCE" in die LUTl eingetragen. 

Bine gultige ID (0103) wird an die LUT2 weitergeleitet IDs die innerhaib von Befehlen, also durch einen Operanden, 
angegeben sind (0104), treffen direkt auf die LUT2. Die LUT2 tibersetzt eine eingehende ED in die Adresse der KR/IKR 
innerhaib des CTR. Ist die KR/IKR nicht im CTR gespeichert (es liegt im Cache nichl vor), wird das Signal "Miss" ge- 10 
neriert (0105). Ist die ubersetzre Adresse der KR/IKR mit dem Token "NoAdr" markiert, wild mil "NoEntry" (0107) an- 
gezeigt, dafi die Adresse geioscht ist "Miss" and "NoEntry" zeigen an, daB eine Ubersetzung auf eine CTR-inleme 
Adresse nicht moglich ist Auf Grundlage dieses Signals iadt die LOAD-Statemachine die KR/IKR mit der entsprechen- 
den ID von einer darOberliegenden CT nach. Sofem eine gultige Adresse varhanden ist, wird diese an die Pointerarith- 
metik des Adressgenerators weitergeleitet (0106). In LUT1 wird ein eingehender binarer Iriggervektor entweder in eine 15 
ID oder einen weiteren Iriggervektor ubersetzt, wobei in diesem Fall der Iriggervektor ausgegeben wird (0108). 

Ib Fig. 2 ist der Ablauf beim Laden einer KR/IKR dargestellt Zunachst wird die ID (0201) der zu Iadenden KR/KR 
an die darOberiiegende CT gesendet Daraufhin wird in die LUT2 an der S telle des Emtrages fur die angefordertelD der 
Wert des FreeFriuters (FP) eingetragen. FP zeigt auf den Eintrag hinter dem letzten fur eine KR/IKR genutzen Eintrag 
im CTR. Dies ist der erste Eintrag, auf den die2u ladende KR/IKR gespeichert wird. 20 

Die Statemachine wartet auf ein Datenwort von der druberliegenden CT Sobald das Wort vetfugbar ist, wird es an die 
durch FP lererenzierte S telle geschrieben. FP wird inkrementierL Zeigt FP auf einen Eintrag hinter dem Ende des CTR 
wird der erste Eintrag im CTR entfeml urn PLatz zu schaSen (0202); dabei wird FP aktualisiert 

1st das von der daruberhegenen CT gesendete Datenwort "STOP", wird dex Ladevorgang abgebrochen (0203), anson- 
sten mil dem Warten auf ein neues Datenwort fortgesetzt (0204). 25 

In Fig. 3a ist dex "MASK"-Befehl darges&ellL Dex Operand des Befehls wird in das MASK-Register geschrieben. Das 
MASK-Register befindei sich am Eingang der Itiggersignale vor LUTl und maskiert ungultige Trigger aus. 

In Kg. 3b wird durch den Befehl "TRIGGER" dex Operand des Befehls als Iriggervektor zu den anderen CIs abge- 
sendet 

In Fig. 3c wird durch den Befehl 'REFERENCE" die Obersetzung eines Triggers zu derentsprechenden KR/IKR ID 30 
in die LUTl geschrieben. 

In F5g. 4a wir der Befehl "WATT dargestelli. Der Operand des Befehls wird in das WAITMASK-Register geschrie- 
ben. Alle Trigger, bis auf den/die Erwarteten und dahex in WA1TMASK freigescbalteten werden ignoriert Erst nach Auf- 
treten des Triggers wird zum ProgrammnuB zuruckgekehrt 

In Fig. 4b ist der "FUSHVBefehl abgebildet Das Konfigurationswort wild zum adressierten konfigurierbaren Element 35 
(CEL) gesendet Akzeptiert das CEL das Konfigurationswort nicht; da das CEL sich beispielsweise im Zustand "nicht 
konfigurie^bar ,, , (vgL DE 197 04 728.9) befindet; wird das Konfigurationswort in den FUMO geschrieben (0401). 

Fig, 5 zeigt den Ablauf eines "REMO VE"-Befehles. Es gibt zwei AufnifVarianten: 

1. Die erste im CTR Hegende KR/EKR wird aus dem CTR entfem t Dem G arbagePoin ter (GP) wird die Adresse 0 40 
des CIR. zugewiesen (0501). 

2. Bne spezifisch durch ihrc ID angegebene KR/IKR wird aus dem CTR entfemt Dem GarbagePointer (GP) wird 
die erste Adresse des zu entfernenden KR/IKR im CTR zugewiesen (0502). 

Der MovePoinier wird mit dem Wert von GP geladen. GP und MP referenzieren auf einen "BEGIN <LD>*-Befehl im 45 
CTR, auch wenn die erste KR/IKR aus dem CTR entfernt werden soil Die betreffende ID wird in LUT2 als ungultig 
markiert MP wird so lange inkrementiert, bis das "BEGIN <£D>" des nachsten im Spe&bex liegenden KR/IKR erreicht 
wird (0503), ODER MP gleich dem FrecPointex (FP) ist das bedeutet, dafi die zu entfemende KR/IKR die letzte im CTR 
ist (0504). 

SO 

- In diesem Fall wird FP mit dem Wert von GP geladen, wodurch die durch die zu lfischende KR/IKR bekgteo 
Speicherstellen als fxei markiert werden; und die Funktion "REMOVE" ist beendet (0505). 

- Andernfalls ("BEGIN <ID>" wird erreicht (0506)) werden die durch MP referenzierten Damn an die durch GP 
referen zierte SpeichersteUe kopiert MP und GP werden mkremetiert Diescr Abl auf findet so lange stall, bis MP das 
Ende von CTR oder die Position von FP erreicht hat (0507). Wird wahrend des Ablaufes dumb MP eine Speicher- 55 
sidle referenziext, in der "BEGIN <ID>" stent, wird dex Eintrag fur (he entsprechende ID in LUT2 mit MP uber- 
schrieben (0508), daznit bei einem Lookup die richtige Speicherstelle ausgegeben wird. 

Fig. 6 zeigt das Ablaufdiagram des FTLMOs. Ein FUMO beinhaltet drei Pointer 

60 

1. WriteP: Der Schreibzeiger des FILMO-RAM 

2. ReadP: Der Lesezeiger des FELMORAM 

3. FullP: Der Zustandszeiger, der den "F011stand n des FILMO-RAMs reprasentierl und einen Unteriauf, bzw. Obex* 
lauf verhindert 

65 

Ein ein-Bit Register "BeginF* zeigt an, ob sich der aktuelie Lesezugriff am Anfang des FILMO-RAMs befindet 
(TRUE), d. h. keine nicht geloscbten Eintr&ge befinden sich zwischen dem Lesezeiger und dem Beginn des FILMO- 
RAMs; oder sich der Lesezeiger in der Mitte des FILMO-RAMS befindet (FALSE), also benutzte Eintrage zwischen 
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dem Lesezeiger und dem Beginn des FTLMO-RAMS liegen. 

Wei terhin existieren zwei Register zirm Speichero der Zustande des ReadP und FullH Es ist notwendig beim Auftreten 
des ersten ungeloschten Eintrages die beiden Register zu skbern, da bei einem spa* ter stettfindenden Lesezugriff an der 
S telle dieses Eintrages mit dem Auslesen begonnen werden muB. Andererseits miissen jedoch ReadP und FulIP wahrend 
5 des aktuellen Lesevorgauges weiterhin raodifiziert werden, urn die nachsten Leseadressen zu erbalten, bzw. das Ende des 
FILMORAMs festzustellen. Durch den Aufbau des FTLMOs als FIFO-ahnliche Stroktur - als sogenannlen Ringspei- 
cber - kann Beginn und Ende des Speichers nicbt anhand einer Adresse 0 oder eine Maximaladresse festgelegt werden. 

A us dem Grundzustand fuhren zwei Ablaufpfade: 

10 l.Lesepfad(0601) 

FulIP und ReadP werden in die Register gesicbert. 
Die Abarbeitungsschleife beginnt: 
BeginF ist TRUE. 

15 Ist FulIP gleicb 0* werden ReadP und FulIP aus ibren Registern zuruckgelesen (0602) und die StaiemacWne springt in 
den Grundzustand zurucL 

Ansonsten (0603) wird getestet, ob der Eintrag im FILMO, auf den ReadP zeigt gleicb "NOP" ist, d. h. es handelt sich 
um einen als geioscht markierten Eintrag in der Mitte des FTLMOs. Ist dies nicbt der Fall (0604) wird versucbt den Ein- 
trag in das konfigurierbare Element (CEL) zu schreiben. Gelingt dies nicht (REJECT, vgL DE 197 04 728.9, 0605), da 
20 CEL nicbt umkonfiguderbar ist, wird BeginF auf FALSE geselzt, FulIP dekrementiert und ReadP inkrernentiert. Die Sta- 
temachine spriagt an den Beginn der Abarbeitungsschleife (0606). Gelingt das Schreiben des Eintrages an das CEL 
(0607), oder der Eintrag ist ein NOP, wird BeginF gestestet: 

BeginF == TRUE (0608): Es liegen keine ungeloschten Eiotrfige vor diesem, FulIP wird inkremenn'ert, ReadP wird in 
dem zugeordneten Register gesicbert, um den neuen Anfang des FILMOs festzuhaitea, FulIP wird gesicbert um die ak- 
25 tuelle Datenmenge festzuhalten; ReadP wird inkremendert 

BeginF «=* FALSE (0609); FulIP wird mkrememierl und der aktueBe Eintrag im FILMORAM mit NOP uberscnrieben, 
d. h. der Eintrag wird geloscht ReadP wird inkremendert Da beiden Fallen springt die Statemacirine an den Beginn der 
Abarbeitungsschleife. 

30 2. Schreibpfad (0610) 

Es wird getestet, ob der FILMORAM vofl ist, indem FuHP auf den maximalen TOrt OberprOft wird Ist dies der Fall 
(0611), wird in den Lesepfad gesprungen um Platz zu schafferL 
Ansonsten wird das Datenwort in den FILMO-RAM gescbrieben und WriteP und FulIP inkrementierL 
35 Fig, 7 zeigt den Ablauf in der Hauptstatemacriine. Der Grundzustand (IDLE) wird veriassen, sobald ein 

1. REMOVErK<niunando von a^damberliegenden CT auftritl (0701): 

Der REMO VE-Befebl wild ausgefuhrt und die Statemacnine kenrt nacb IDLE zuruck. 

2. Ein Triggersignal zur Genederung ernes Triggers zwiscben den CIs auftritt (0702): 

40 Der Trigger wird ausgegeben. Die Statemacnine springt in den "STDP^Berenl und danach nach IDLE zuruck. 

3. Hn Triggersignal zur Ausfuhrung eines KR/IKR <ID> aurMtt (0703): 

DerPrograrnPointer (PP) wird mil der durcb LUT2 generierten Adresse geladen. Ist die Adresse unguTtig, d b. kern 
Eintrag fur das zu ladende KR/IKR vomanden, wird dieses geladen (0704) nndPPneu gesetzL 

45 Die Ausfunxungsschleife beginnU 

PP wird inkrementiert (beim ersten Schleifendurchlauf wird dadurch der BEGIN <3D>-Befehl Obersprungen), das Auf- 
treten weiterer Trigger wird unterbunden, RECX)NHgur (vgl. DE 197 04 72S.9) wird gespexrt Die Befehle werden aus- 
gefuhrt und zum Beginn der Ausfunnmgsschleife gesprungen (0707). 
Der Befchl "STOP" wird gcsondert ausgefuhrt (0705). Die Trigger und RECONHG (vgL DE 197 04 728.9) werden 

50 wieder frrigeschaltet und die Statemachine springt nacb IDLE Der Befchl "EXECUTE" wird ebenfaBs gesondert aus- 
gefuhrt (0706). Die in EXECUTE <TD> angegebene TO wird in das JD-REG geschrieben. PP wird neu geladen und die 
durch ID angegebene KR/IKR ausgefuhrt (0708). 

Nach einem Reset der CT wird die Grundkonfiguration in das CTR geladen und direkt in die Ausfuhrung der Crund- 
kon figuration gesprungen (0709) 

55 Fig* 8 zeigt den Aufbau eines SCRR-ARB. Die zu arbitrierenden Signale gelangen fiber Dataln auf eine Maske (0801), 
die gemaB der bekannten Tabelle einen zusammenhangenden Teil der Signale durchscbaltet, bzw. sperrt. Ein gewohnli- 
cher Prioritfitsarbiter (0802) nacb dem Stand der Tecbnik arbimert ein Signal aus der Menge derDurchgeschaiteten und 
lieferte dessen Binarvektor (BinaryOut) zusammen mit einer gultigAjngultig-Kennung (ValxiOut) (ebenfalls gemaB dem 
Stand der Technik) als Ausgang des SCRR-ARB. 

60 Dieses Signal wird gemaB der bekannten Tabelle dekocfaert (0803) und auf eon Register zur Taktsyncbmmsierung 
(0804) gefUhrL Uber dieses Register wird die Dataln Maske gescbaltet Dabei wird das Register entweder durch einen 
Takt oder ein Next-Signal (Enable EN), das den nachsten gUltigen Binarvektor abfragt gesteuerL Bei einem Reset oder 
wenn die Kennung (VaHdOut) ungiiltig anzeigt wird das Register so gescbaltet, daB die Dataln Maske aUe Signale durch- 
schalteL 

05 Der Aufbau <kr Maske ist in 0805 dargestellL 

In F|g» 9 ist die LUT-Struktur abgebildet Der Binarvektor (Binaryln) des arbicrierten Triggers wird auf den Adress- 
eingang der LUT1 (0901) gefuhrt. 
LUT1 iibersetzt den Binarvektor entweder in einen gOUigen Trigger um chesen an eine andere CT weiterzuleiten oder 
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eine guTtige ID. Beide werden Uber 0910 ausgcgeben. 0911 zeigt an, ob es sicb um einen Trigger oder eine ID handelL 1st 
Qber den Befebl "REFERENCE" keine Obersetzung des eingehenden Binarvektors in LUT1 eingetragen, wild - mittels 
eines Biteintrages oder eines Verglekhers auf ein bestimmtes lb ken (z. B. "VOID 4 *) - das Signal "Illegal 'Rigger'* 0914 
geaeriert 

Ein Trigger wild liber 0912 an exteme CTs geffihrt, IDs werdeo Qber den Multiplexer (0902) weiterverarbeitet. 0902 5 
schaltet entweder der Datenausgang von LUTl, der eine gtlltige ID angibt, oder das ID-Register (0903) der CT auf den 
Adresseingang der LTJT2 (0904). 0904 besitzt eine Cacbeahnliche Struktur, d. h. der niederwertige Teil (0906) des Da- 
tenausgangs von 0902 wird auf den Adiesseingang von 0904 geschalteU wahrend der hoherwertige Tfeil (0907) auf den 
Dateneingang von 0904 geschaltet wird. Der 0907 geboxende Datenausgang wild uber einen Komparator (0905) mit 
0907 verglicheru Der Vbrteil dieses Verfahrens ist, daB 0904 nicht die Uefe zur tJbersetzung aller IDs aufweisen muB, 10 
sondera exbebiich kleiner ausf alien kann. Ahnlich eines gewohnlichen Caches wird lediglicb ein 1e0 der IDs tibersetzt, 
wobei in der LUT2 anband 0907 festgestellt werden kann, ob die selekn'erte ID der von LUTl angegebenen eotsprichL 
Dies entspricfat einem Cache/IAG-Verfabren nach dent Stand der Technik. 

Einem zweiten Dateneingang von 0904 ist ein Multiplexer 0908 zugeordnet, der je nach deration den FreePointer 
(FP, Operation LOAD), dea GarbagePointer (GP, Operation REMOVE) oder eine Tnvalid-Kennung/Token (NoAdr, 15 
Operation REMOVE) zur Speicberung an LUT2 liefert. Die beiden Pointer referenzieren auf Speicherstellen im CTR* 
"NoAdr" gibt an, daB kein Eintrag zu der passenden ID existiert, der Eintrag geloscbt wurde. Dies wird am Datenausgang 
festgesteOt, indem fiber den Vergleicher 0909 die Daten auf das Ibken "NoAdr" verglichen werden. 

An die Statemachine wird weitergeleitet: 

20 

- Das Auftreten eines Binarvektors wird fiber "Validln" (vgL Fig. 8). 

- Die Angabe ob es sicb bei der tJbersetzung in LUT1 um einen Trigger oder eine ID handelt (0911, "Trigger/ID 
Out*). Thgger werden uber 0912 an andere CTs weitergeleitet, IDs werden in der eigenen CT abgearbeitet und an 
die LUT2 weitergeleiteL 

- Das Ergebnis von 0905, das angibt, ob die entsprechende ID in 0904 gespekhert ist ("Hit/Miss Out"). 25 

- Das Ergebnis von 0909, das angibt, ob die entsprecbende ID auf eine gultige Adresse im CTR zeigt CNoEntry 
Our) Die von 0904 generierte Adresse wild an das CTR weitergeleitet CCTR Address OutW). 

Die LUT1 wird Uber den Befehl "REFERENCE" mit der tJbersetzung des eingebenden Binarvektors auf einen Trigger 
oder ID geladen. Die Operanden des Befehis werden Qber den Bus 0913 an die LUTl gefuhrL Uber dense Iben Bus wird 30 
das ID-Register (0909) geladen. 

Fig. 10 zeigt die Pointerarithmetik des GarbagePointer (PG), ProgramPbinter (FP), MovePoinler (MP) und FreePoin- 
ter (FP). Jeder Pointer bestehl aus einem getreoot ansteuerbaren ladbaren up/down-Zahien Jeder Zahler kann - sofem 
notwendig - mit dem Wert jedes anderen Zablers geladen werden; ebensowie mit der Ausgabe vonLlJT2 0.007). 

Uber Vergleicher wird festgestelU ob 35 

1. ?P gleich MP 

2. MPgleichEP 

3. FP gleich der maxim a ten Position im CTR 

40 

ist. Die Ergebnisse werden zur Steuerung der Statemadrines verwendeL 

Ober einen Multiplexer (1001) wild einer der Pointer zum Adresseingang des CTR geleiteL Die Daten gelangen fiber 
einen Multiplexer (1002) entweder von der ubergeordneten CT (1005) oder aus einem Register (1003) an das CTR. Zur 
Statemachine und zum FILMO (f 006) werden Uber einen Multiplexer (1004) entweder die Daten von der Ubergeordne- 
ten CT oder des CTR weitergeleitet Dabei wird beim Auftreten eines REMOVE-Befehls von der ubergeordneten CT der 45 
direkt Ober 1004 an die Statemachine geleitet, w&hrend ansonsteo die Befehle bus dem CTR an die Statemachine gefuhrt 
werden. Das Register 1003 dient zur Speicberung und Ruckkoppiung von Befeblen auf den CTR Eingang, die wahrend 
eines Durchlaufs des Garbage-Kollektors von einer Adresse an cine andere geschoben werden. 

Der Aufbau eines FILMOs ist in Kg. 1 1 dargestellL Die Daten gelangen von dem CTR (U01) in das FTLMO und wer- 
den entwerder Qber den Multiplexer (1102) in das FILMO- RAM (1103) geschrieben oder uber den Multiplexer (1104) an 50 
die fconfigruierbaren Elemente (1116) gesendet Werden Daten in 1103 geloscbt, wird Qber 1102 eine "NOP^-Token nach 
1103 geschrieben. Ober den \fergldcher (1106) am Datenausgang wird das w NOP M -Token erkannt und ein Schreiben zu 
den konfigurierbaren Elementen verhindert Uber den Multiplexer 1106 wird entweder der Schreibzeiger WriteP (1107) 
oder der Lesezeiger (1108) an den Adresseingang von 1103 gefuhrL In dem Register 1109 wird der Lesczeiger gesichert 
um ein Riicksetzen (siehe Fig. 6) zu ermSglichen. 55 

Der FQllstandszihler Full (1110) von 1103 wild gexnafi fig. 6 in dem Register 1111 zum Riicksetzen gespeicbert Zwei 
Vergleicher testen, ob 1103 leer (1112) oder vol! (1113) ist Dber den Multiplexer 1115 wird selektiert, ob die Steuersi- 
gnale der S tatemachine (von 1101) oder des FILMOs an 1116 gesendet wird 

Fig. 12a zeigt den hierarcfaischen Aufbau der CTs. AUe CTs bezieben ihre Daten aus der ROOT-CT (1201) und dem 
ihr zugeordneten ECR (1204). Fur jede Lnplementierungsebene in einem Baustein existiert eine oder mehrere CTs. Jede 60 
CT ist fur die Verwaltung inter Ebene und der darunteriiegeuden CTs zustandig. Es ist nicht notwendig, daB alle Aste das 
Baumes gleich uef sind. Beispielsweise ktinnen weniger Ebenen zur Steuerung der Peripherie (1202) eines Bausteines 
existieren als zur Steuerung der Arbeitseinheiten (1203) Der Datentransfer erfolgt baumartig. Jede CT arbeitet a!s Cache 
fur alle unter ihr liegenden CIs. 

Fig. 12b zeigt den TYiggerfluB zwischen den Clk Wahrend der DatenfluB baumartig verlauft, ist der TViggerftuB nicht 65 
festgelegL Jede CT kann an jede andere einen Trigger sen den. Fur gewdbnlich findet ein Triggeraustausch nur von den 
Blaitem (1203) in Richtung der ROOT-CT (1201) statL Unter Umstanden kann der Transfer jedocb auch in die entge- 
gengesetzte Richtung verlaufen. 
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In Fig, 12c ist ein Triggervektor Broadcast dargestellt, wobei 1205 einen Triggervektor an alle CIs sendet Fig. 12d 
zeigt eiaen HIGHER-Triggervektar, den 1206 an die fiber ihr liegende CT sendet 1207 sendet ein en LOWER-Trigger- 
vektor an alle miter ihr liegenden Clb. 1208 iibertragt einen direkt adressierten (ADDR£SSED)-Triggervektor an eine 
bestimmte CT, die rticht direkt mit 1207 verbunden ist. 
s In Fig. 1 3 fordern zwei unabbangige IKR n und m eine gemeinsame, in der daruberliegenden CT gecachte KRx an. Es 
ist angedeutet, daB diese KR von dera gesamten Ast gecachet wird und auch in einem Nachbarast (1301) Uber eine ge- 
meinsame CT verfugbar ist. 

Fig. 14 zeigt ein gegenfiber Fig- 9 modifiziertes LUT- System, das in ROOT-Cfls und CTs mittlerer Hierarchieebenen 
verwendet wild. Der grundlegende Unterschied zu den bislang beschriebenen CTs ist, daB anstatt einzelner Triggersi- 

10 gnale H>- und/oder Trigger-\fektoren von der CT verwaltet werden mussen. Jedexn Vfektor ist dabei ein Handshake-Si- 
gnal (RDY, vgl. DE 197 04 728.9) zur Anzeige der Gflltigkeit des Vektors zugeordnet, die an einen Arbiter (1401) gelei- 
tet werden. Uber die Multiplexer (1402, 1403) wild entweder einer der Txiggervektoren (1404) oder einer der ID-Vekto- 
ren (1405) ausgewahlt Iriggervektoien gelangen direkt auf den Adresseingang der LUT1 (1406), die ansonsten gemaB 
Fig. 9 beschalret ist. Das ID-Register (1407) ist ebenfalls gemaB Fig. 9 beschalleL Im Gegensatz zu Fig. 9 besilzt der 

15 Multiplexer 1406 drei Eingange (vgl. 0902). Der Multiplexer wild dabei aufier von der Statemachine zusatzlich von dem 
Arbiter 1401 angesteuert Uber den zusatzlichen Eingang werden n>\fektoren uber 1403 direkt an die LUT2 weiterge- 
leitet. Dazu diem der Bus 1409. "Trigger/ID Out" wird gemfiB Fig. 9 generiert Ein "Validln" Signal, das gemaB Fi£ 9 
auf ein p Valid Out" weitergeleitet wild existiert nicht. Statt dessen wird je each Arbitrierung durch 1401 ein "Valid Trig- 
ger Out" fur Iriggervektoren und ein "Valid ID Out" fUr ID-Vektoren generiert, urn die Statemachine anzuweisen, wie 

20 die Verarbeitung stattzufinden hat 

Der Bus 1409 wird fiber 1410 an eine weitere Enheit geleitet, die nur in der ROOT-CT exi stiert und in Fig. 15 be- 
schrieben ist. 

Eine ROOT-CT benotigi zusltzHch zu den normalen CT-Funkdonen ein Interface zu dem extern en Konfigurarions- 
speicher (ECR), sowie den erfbrderlichen Adressgenerator und Bnheiien zum Verwalien der Zugriffe auf den ECR. 

25 Eine gewohnhche CT ubersetzt in LUT1 eingebende Iriggervektoren auf einen ID und in LUT2 das ID auf eine Spei- 
cherstelle im CTR (siehe Fig. 16a). Eine ROOT-CT ubersetzt bei Zugriffen auf das ECR eine ID innerhalb des ECR auf 
eine Adresse im ECR, an der das durch TD rererenzkxt KR/IKR begmnt Dazu ist ein Speicherbereich im ECR f estge- 
legt, dessen GrtiBe der mdgBcben Anzahl an IDs entspricbt (ist beispielsweise eine ID 10-bit brext, exgibt das 2 l ° = 1024 
mogliche IDs, also werden 1024 Emtrage im ECR reserviert). In den folgenden Beasptekn befindet sich dieser Speicher- 

30 bereich am unteren Ende des ECRs und wird LUT-ECR genannt um die AhnHchkeil zur LUT2 zu untex&treierjeu. Die 
Ubersetzung eines Triggers auf eine ID findet dabei gemaB den bereits bekannten CIs in der LUT1 statt (1601). Zum bes- 
seren Verstandnis verdeutliehtFfe. 16b den Zugriff auf das ECR. 

Eine ID gelangtinFig. 15 fiber den Bus 1410 auf Fig. 14 an den Multiplexer 1501. Obex 1501 wird die 3D in den lad- 
baren ZShler 1502 geschrieben. Der Ausgang von 1502 flihrt fiber einen Multiplexer 1503 an den Adressbus (1504) des 

35 ECR. Uber den Datenbus 1506 gelangt die Ubersetzung der ID auf eine Speicheradresse uber einen Multiplexer/Demul- 
tiplexer (1506) an 150t der 1502 mit der Speicheradresse ladL Daraufhin werden fiber die Statemachine LOAD- ECR 
(siehe Fig. 17) die Datenwfirter der entsnrechenden KR/IKR aus dem ECR gelescn und in das CTR geschrieben, wobei 
1502 nachjedem Lesevorgang erhoht wird; so lange, bis der Befehi "STOP" gelesen wurde. 
tJber das Interface 1507 schreibt der ubergeordnete HOST fiber 1503/1506 die KR/IXR in das ECR- Dabei wird uber 

40 die Statemachine (CTS) arbitriert, ob der HOST Oder die ROOT-CT Zugriff auf das ECR haL 

Nach einem Reset des Bausteines muB eine Gmndkonn^uration (BOOT-KR) geladen werden. Dazu wird eine teste 
Speicheradresse (BOOT-ADR) eingefuhrt, die auf die erste Spekherstelle der BOOT-KR zeigt Als BOOT- ADR wird 
die Speichcrstette Oh empfohlen, sofern die IDs bei 1 begirmen, andemfalls kann 2 10 oder irgend eine andere Spekher- 
stelle verwendet werdea In dem Ausfuhrungsbeispiel wird 2 m verwendet, 

45 Die ROOT-CT fumt zum Laden der BOOT-KR an der SteQe BOOT-ADR einen Lookup durch, sorera eine BOOT-KR 
geladen ist. Die ROOT-CT schreibt die Daren nach 1502 um von dort die BOOT-KR bis zum Auftreten eines "STOP" 
Befehls zu laden. 

Eine Oberwachungseinheit innerbalb der ROOT-CT Qbemimmt die Synchronisation des HOST mit dem Bau stein. 
Dies geschiebt folgeodermaBen: 
50 Die Adressen kleine 2P werden durch 1508 uberwacht, d. h. bei Zugriffen auf diese Adressen durch den HOST wird ein 
Signal (ACC-TD) an die Statemachine (CTS) gesendet Ebenfalls wird BOOT-ADR fiber 1509 uberwacht und sendet ein 
Signal ACC-BOOT an die SWmacrrinc(CTS). 

Die Statemachine (CTS) reagiert wie folgt: 

$5 - Schreibt HOST auf die BOOT-ADR, bewirkt dies das Laden der BOOT-KR. 

Schreibt HOST das Datenwort 0 (1512) auf die BOOT-ADR, wird dies fiber den Komparator 1510 restgestellt 
und bewirkt das Anhalten des Bausteines. 

- schreibt der HOST auf eine Adresse kteiner 2 ID wird die Adresse in das REMOVE-Register (1511) geladen. Da 
die Adresse der ID entspricbt (siehe ECR-LUT) stent die ID der geanderten KR/IKR in 1511. An alle CTs wird der 
60 Bcfchl REMOVE <ED> zur sofbrtigen Austurirurig gesendet (1513). Die CIs loschen daraufhin die KR/IKR der 
entsprecbenden ID aus ihrem CTR, bzw. LUT2. Bei einem nachrblgenden Aufruf der KR/IKR mfissen die CTs 
zwangslaufig die neue KR/IKR aus dem ECR laden. 

Fig. 17 zeigt den Ablauf in einer ROOT-CT bei Laden einer KR/IKR aus dem ECR. Befindet sich eine ID nicht im in- 
65 temen CTR (vgL Fig. 1, 1701) wird die ID in den Zahler 1502 geschrieben (1703). En Zugriff auf das ECR rrrit der 
Adresse in 1502 liefert die Basis adresse der KR/IKR. Diese wird in 1502 geschrieben (1704). Ein LOAD gemaB Fig. 2 
findet start (1702). Dabei werden die Daten statt von einer Ubergeordneteo CT aus dem ECR gelesen (1705) und nicht 
nur in das eigene CTR geschrieben, sondem, an die uuiergeoxdnete CT gesendet (1706). 
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Id einer CT mitllerer Hierarchieebene lauft die "Obcrsetzung der Trigger ahnlich Fig. 1, mit der Ausnahme, daB Trig- 
gervektoren und ED- Vektoren gem SB Fig. 14 bebandell werden. Die KR/EKR werden gemaB Fig. 2 geladen, mit der Aus- 
nahme, dafi die Datenworte nicht nur in das eigene CTR geschrieben werden (0210), soodern gleichzeitig an die unter- 
geordnete CT geseudet werden. 

Fig. 19 verdeutlicht das HLMO Prinzip. Der FELMO (1901) wird bei lesendeo und schreibenden Zugriffen immer 5 
vom Anfang zum Ende durchlaufen (1902). Werden Eintr&ge vom Anfang des FCLMOs geschrieben und geldscht 
(1903), wird der Lesezeiger auf den ersten uogeldschten Eintrag verschoben (1904). Werden Eintrage aus der Mitte das 
FTLMOs geschrieben (1905), bleibt der Lesezeiger unverandert (1906), die EintrSge werden mit "NOP" markiert (1907) 
Werden Daten in das HLMO geschrieben (1908), werden diese am Ende, hinter dem letzteo Eintrag angehangt (1909). 
Der Lesezeiger (1910) bleibt unverandert to 

Selbstverstandlicb kann eine CT mit nur einem Speicher, der LUT1, LUT2 und CTR umfaBt aufgebaut werden. Die 
Steuerung dafurist jedoch aurwendiger. Die CR sind dabei Shnlich der ROOT-CT aufgebaut, die bereits die LUT2 UND 
das CTR im ECR iniegriert. Fur das \ferstandnis des Verfahrens ist eine Beschreibung dieser CIs nicht erforderiicb. 

Wird eine CT als Cachesysiem fur Daten eingesetzt, werden Trigger zum Schreiben von Daten in das CTR eiogefuhrt 
Dabei werden die Daten von einer CEL in das CTR geschrieben. Die hierzu notwendigen Anderungen sind trivial das 15 
FELMO kann kompfeU entf alien. 

Beim Cachen der Daten rritt das Problem der Datenkonsistenz auf. Dies kann umgangen werden, indem ein \ferfahren 
gem2BDE 42 21 278 Al eingesetzt wird, urn die Daten und deren Gultigkeit in den eanzemen Ifierarchieebenen zu kerm- 
zeichnen. Werden Daten zur Durchftlhrung eines Read-Modify-Write-Zyklusses (RMW-Zyklus) angefordert, werden die 
Daten auf alien Hierarchieebenen anhand eines zusfitzlichen Eintrag es in dem CTR/ECR als "ungtiltig" (INVALID) ge- 20 
kennzeichnet In den Eintrag kann dazu die cindeutige ID der die Daten benutzenden KR/IKK eingetrageo werden. Die 
Daten kfinnen so lange von keiner KR/IKR nrit anderer ID benutzt werden, bis die (fie Daten benutzende KR/EKR die Da- 
ten zunickgeschrieben (vgl. Write-B ack-Methode nacb dem Stand der Technik) und ihre ID geloscbt hat 

Fig. 20 zeigt ein Ausfunrungsbeispiek 

In Fig. 20a fordert die CT 2007 Daten von der darubertiegenden CT an, diese fordert die Daten von der ROOT-CT 25 
2004; mit der Datenanfbiderung wird die ID der Anfordemden KR/IKR (2001) ubertragen. Die Daten (2002) werden an 
2007 gesendeU Alk anderen, spaleren Zugriflfe werden abgewiesen (2003). 

In Fig. 20b werden die Daten zuruckgeschrieben (2005), anderen, spaleren Zugrifle werden wieder akzeptiert (2006) 
In Fig. 20c werden Daten von einer CT mitueren Hierarchie angefordert, im Besitz der Daten ist und diese an 2007 sen - 
dct Die ID zum Spenen der Daten wird an alle CIs in der Hierarchie gesendet (2001). Beim Ruckschreiben der Daten 30 
(Write-Back) in Fig. 20d werden die Daten an alle CIs in der Hierarchic geschrieben und die ID geloscbt. 
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BegruTsdefiniuon 

Broadcast: Senden eincr Infarmation an einc Vielzahl von Empfangem. 
30 Datenempfanger: Die Emheit(eo), die Ergebnisse dcr CEL werterveraiteitet/-arbeiten 

Daten sender Die Hnheit(en) f die Dalen fur die CEL als Operanden zur Vferfugung stellt/slellen 

Datenwort: Ein Datenwart bestefal aus einer behebig langen Bit-Reihe. Dicse Bit-Reihe stelli eine \ferarbeitungsein- 

heitfur eine Anlage dar. In einem Datenwort kdonen sowohlBefehle fur Prozessoien oJeL Bausteine sowie rein Daten ko- 

diert werden. 

35 Deadlock: Zustand, indem aufgrund gegenseitiger Blockade keineriei Daten verarbeitung moglich isL 
DFP: DatenfluBprozessor nacb Patent/Offenlegung DE 44 16 881 
DPGA: Dyramisch konfigurierbarc FFGAs. Stand der lechnik 

Hemente: Sammelbegriff fur alle Arten von in sich abgescnlossenen Einbeiten, wclcbe als Stuck in einem elektroni- 
schen Baustein zum Einsatz kommen kOnnen. Ftemqpte $jnd also: 

40 

- Xonfigurierbare Zelleo filler Ait 

- Ouster 

- RAM-BIocke 

- Logik 

45 - Rechenwerke 

- Register 

- Multiplexer 

- I/O Pins eines Chips 

50 Ereignis: Ein Ereignis kann dutch ein Hardwareetement in irgendemer zur Anwendung passenden Art and Weise aus* 
gewertet werden und als Reaktion auf chese Auswertung eine bediogte Aktion auslfisen. Ereignisse $ind somit zum Bei- 
spkL' 

- Taktzyklus dncr Rechenanlage. 

5$ - internes oder externes Interrupt-StgnaL 

- Trigger-Signal von anderen Elementen innerhalb des Bausteines, 

- Vergleicb eines Datenstzotns und/oder eines Befehlstroms mit einem Wert. 

- Input/Output Ereigenisse. 

- Ablaufen, fiberlaufen, neusetzen etc. eines Zahlers. 
do - Auswcrten eines Vcrgieichs. 

FIFO: First-In, First-Out Speicber nach dem Stand der Ibchnik 

FUMO: Abgewandeltes FIFO, aus dem linear Daten gelesen werden. Eine Bescitraukung des Lesezeigers auf den Be- 
gum des Speichers ist nicbt varnandeiL 
65 FPGA: ProgrammicrbaTcr Logikbaustein. Stand der Ibchnik. 

F-FLUREG Register in dem die Funktion der CEL gesetzt wind. Ebenf alls wild der OneSbot- und Sleep-Mode gesetzt 
Das Register wird von der PLU beschrieben. 
Fragmenuerung: Zerteilen von Speichei in eine Vielzahl oftmals kleiner und damit nutzloser Speicuerbereicbe. 
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Garbage-KoUektor: Einheit zum Vcrwalten des Speichers. Vferhindert eine Fragmentierung. 
H-Pegel: Logisch 1 Pegel, abhangig von der verwendelen Tfechnologie 
HOST Einem Baustein oderBaugruppe ubergeordneter Rechner. 

IDLE-Zyklus; Zyklus, in dem eine Stateraachine keine Verarbeitung diirchflihrL Grundzustand einer Statemachine. 
Pointer Zeiger auf eine Adresse bzw. ein Datenwort, 

konfigurierbares Element: Ein konfigurierbares Element stellt eine Einheit eines Logik-Bausteines dai; welcbe durch 
ein Xonfigurationswort fur eine spezieUe Fuoktion eingestellt wetden fcaim. Konfigurierbare Elemente sind somit, alle 
Arten von RAM Zellen, Multiplexer, ArinimetiscbelpgiscbeEinheiten, Register und alle Arten voninternerundextemer 
Vernetzungsbeschreibung etc. 

konfigurieibare Zelle: Siehe Logifczellen 

Konfiguriecen: Einstellen der Funkdon und Vernetzung einer togiscben Einheit, einer (FPGA>Zelle oder einer CEL 
(vgL umkonfigurieien). 
Kbnfigurationsdaten: Beliebige Menge von Konfigurationsworten. 

Konfigurationsioutine: Meniere Konfigurationsworte zu einem Algorithmus zusammengefiigte. 

Konfigurationsspeichen Der Konfigurationspeicher enthalt ein oder mehrere Konfigurationsworte. 

Xonfigurationswort: Ein Konhgurationswort besteht aus einer beliebig langen Bit-Reihe. Diese Bit-Reihe stellt eine 
gOltige Einstellung fur das zu konfigurierende Element dar, sodas eine funkDonsiWge Einheit entstefat 

Ladelogik: Einheit zum Koufigurieren und Umkonilgurieren der CEL. Ausgestaltet durch einen speziell an seine Auf- 
gabe angepaBten Mikrokontroller. 

Logjkzelleo: Bei DFPs, FFGAs, DPGAs verwendete konfigurieibare Zellen, die einfache logische oder arithrneiische 
Aufgabeo gemaB ihrer Konfiguration erfuUen. 

Lookup-labeUe: Stand der Technik. Verfahren zum t)bersetzen von Daren. 

L-Pegel: Logisch 0 Pegel, abhangig von der verwendeten Ibchnologie. 

Maske: Bitkombination, die die gflltigen Signale innerfaalb einer Mehizahl von Signalen angibL 

FLU: Einheit zum Konfigurieren und Umkonfigurieien der CEL. Ausgestaltet durch einen speziell an seine Aufgabe 
angepafiten Mikrokontroller. 

Priorisierung: FesUegung einer Reihenfolge. 

PECONHG: Rekonfigurierbaier Zustand einer CEL. 

RECONFIG-Trigger Setzen einer CEL in den rekoufigurierbaren Zustand 

REMOVE-<ID>: 1. Befchl mnertralb eines KR zum Enlfemen der durch ID referetizierten KR. 2. Befehl einer iiber- 
geordneten CT fiber ein separates Interface oder Handshaking an eine untenjeordnete CT zum loscben der durch H> re- 
ferenzierten KR. 

RESET: Rucksetzen eines Bausteines oder eines ganzen Computersystems in einen defirrierten Grundzustand. 
ROOT-CT CT der hdchsten Hiemrchiecbenc mit diiektem Ziigriff auf den externeo Kcmfiguranonsspdcber. 
RoiiiK^Pobin-Arbitei: Arbiter der im Kreis lauft und inunerdem zuktzt arbitrierten Signal die medersre Prioritax zu- 
onfaet. 

Statemacbine: siehe Zustandsmaschine. 

Switching-Tabelle: Eine Switcbing-Tabelle 1st ein Ring-Speicher, welcher durch eine Steuerung angesprochen win! 
Die Eintrage einer Switching-Tabelle konnen beliebige Konfiguratkmsworter aufhehmen. Die Steuerung kano Befehle 
durchfuhren. Die Swuching-Tabelle reagiert auf Higgersignale und konfiguriert konfigurierbare Elemente anhand eines 
Eintrages in einem Ringspeicher urn. 

SynchTonisationssigfiale: Staiussignale die von einem konftguricrbaien Element oder einem Rechenwerk genericrt 
werden und zur Steuerung und Synchronisation der Daten verarbeitung an weitete konfigurierbare Element oder Rccheo- 
werke weitergeledtet werden. Es ist aucb moglich ein Synchronisationssignal zeitlieh verzbgert (gespeichert) an ein und 
dasselbe konfigurierbare Element oder Rechenwerk zuruckzukaten. 

Tenninieruog: Beendigung eines Vbrganges, einer Verarbeitung. 

TRIGACK/TRIGRDY: Handshake der Trigger (VgL Handshake der Daten aus P19651075.9) 
Trigger Synonym fur Synchronisation ssignale. 

Umkonfigurieien: Neues Konfigurieren von einer beliebigen Menge von CELs wabreod eine beliebige Resttnenge von 
CELs ihre eigenen Funkrionen fortsetzen (vgL konfigurieren). 

Verarbeitungszyklus: Ein Verarbeitung szyklos beschreibt die Dauer; welcbe von einer Einheit beootigt wild, am von 
einem defirrierten und/oder gflltigen Zustand in den nachsten definierten und/oder gOltigen Zustand, zu gelangen. 

Zellen: Synonym fur konfigurierbare Elemente. 

Zustandsmaschine: I^ogik, die diversen Zustanden annehmen kann. Die Ubergange zwischen den Zustanden sind von 
verscbiedenen Eingangsparametem abhangig. Diese Maschinen werden zur Steuerung komplexer Funktionen eingesetzt 
und entsprechen dem Stand der Technik. 

Patentanspruche 

1. Verfahren zum deadiockfrciea, automatischen Konfigurieren und Rckonfiguricrcn von Bausteinen mit zwei- 
oder mehrdimensionaler Zellanordnung (z. B. FPGAs, DPGAs, DFPs gemaB DE44 16 881 Al, o. dgL), dadurch 
gekennzekbnet, daB eine Einheit zur Steuerung der Konfiguration und Rekonfiguration eine Menge von zugeoroV 
neten konfigurierbaren Elementen verwaltet, wobei die Menge eine Teihnenge ailer konfigurierbaren Elemeate oder 
die Gesamtmenge aller konfigurierbaren Elemente ist, und die Verwaitung wie folgt ablauft 

1.1 Rekonfigurauonsanforderungen von den zugeordncten konfigurierbaren Elementen an die Einheil gesen- 
det werden 

1.2 die Einheit die Anforderungen bearbeitet, indem 

a) keine weiteren Anforderungen und Verarjderungen wShrend der Au&ftihrung akzeptiert werden, 
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b) die nocb zu ladenden Konfigurationsdaten bestehender fruherer Anforderungen aus einem Zwischen- 
speicher (FILMO) in die konfiguriexbaren Elemente geladen werden, 

c) die bestehende Anfordenmg auf eine eindeutige Kennung (ED) umgesetzt wird 

1.3 die ID auf die Adresse der zu ladenden Xonfigurationsdaten im Speicher der Einheit umgesetzt wind, so- 
fem die Konfigurationsdaten im Speicher der Einheit existieren, 

1.4 die Konfigurationsdaten nut der entsprechenden ED bei einer ubergeordneten Einheit angefoidert und ge- 
laden werden, sofem die Konfigurationsdaten nicht im Speicher der Einheit existieren, 

1.5 die Konfigurationsdaten in die konfigurierbaren Elemente geladen werden, sofcm die konfigurierbaren 
Elemente die Daten annehmen konnen, 

1.6 die Konfigurationsdaten der konfigurierbaren Elemente, die die Daten nicht annehmen kbrmen in einen 
Zwischenspeicher geladen werden, 

1.7 nachdem die Konfigurationsdaten vollstBndig abgeaibeitet sind, wieder neu auftrelende Anforderungen 
akzepuert werden, wobei bis zum Auftreten einer erneuten Anrbrderung die noch zu ladenden Konfigurations- 
daten bestehender fruherer Anforderungen auseinem Zwischenspeicher (FILMO) in die konfigurierbaren Ele- 
mente geladen werden. 

2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, daB Konfigurationsdaten, die nicht an die konfigurierbaren 
Blementen angenommen women rind, an das Ende des Zwiscfaenspeichers geschrieben werden. 

3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daB Konfigurationsdaten zom Scfareiben in die kon- 
figurierbaren Elemente vom Anfang zum Ende des Zwischenspeichers gelesen werden, wobei der Zwischenspei- 
cher immer komplett durchlaufen wird. 

4. Verfahren nach Anspruch 1 bis 3, dadurch gekennzeichnet, dafl Konfigurationsdaten, die am Anfang des Zwi- 
scben speichers in die konfigurierbaren Elemente geschrieben werden, im Zwischenspeicher geldscht werden, d h. 
der Lesezeiger wird hinter die geschriebenen Daten gesetzL 

5. Verfahren nach Anspruch 1 bis 4, dadurch gekennzeichnet, daB KonfiguraUonsdaten, die aus der Nfitte des Zwi- 
schenspeichers in die konfigurierbaren Elemente geschrieben werden, 

a) entweder im Zwischenspeicher als geloscht markiert werden und damit bei einem emeuten Lesedurchlauf 
ubersprungen werden, 

b) oder im Zwischenspeicher (FILMO) geldscht werden, indem die noch exisuerenden Konfigurationsdaten 
ausgehend von der zu Ifiscbenden Speicherstelle bis zum Anfang oder zum Ende des Zwiscfaenspeichers (HL- 
MOs) so verscboben werden, daB cue geloscbte Speicherstelle mit bestehenden Konfigurationsdaten belegt isl 
und die Zeiger auf den Beginn oder das Ende des Speichers cntsprechend angepaBt werden. 

6. Verfahren nach Anspruch 1 bis 5, dadurch gekennzeichnet, daB eine Zustandsmaschine (Garbage-Kollektor) den 
Speicher (CTR) der Einheit so verwaltet, daB keine Speicfaeriackeo entstehen, indem Speicberiucken mit existieren- 
den Konfigurationsdaten ausgehend vom Beginn der Speicherlttcke bis zum Ende des Speichers (CTR) so verscbo- 
ben werden, daB die gelflschte Speicherstelle mit bestehenden Konfigurationsdaten belegt ist und die Zeiger auf das 
Ende des Speichers und die {Fbersetzung der IDs auf verschobene Speicherstellen entsprechend angepaBt werden. 

7. Verfahren nach Anspruch 1 bis 6, dadurch gekennzeichnet, daB bei der Einheit cingehende Anforderungen auf 
eine eindeutigc Kennung (ID) einer Konfigurationsroutine fibersetzt wird, und die ID auf eine Speicherstelle im 
Speicher {CTR) zeigt 

8. Verfahren nach Anspruch 1 bis 7, dadurch gekertnzeichnet, daB Konfigurationsdaten das Laden weiterer Konfi- 
gurationsdaten bewirken (EXECUTE). 

9. Verfahren nach Anspruch 1 bis 8, dadurch gekennzeichnet, daB Konfigurationsdaten mittels Anforderung an eine 
andere Einheit das AusfUhren weiterer Konfigurationsdaten in der anderen Einheiten bewirken (TRIGGER), wobei 
die Anforderungen 

a) als Broadcast an alle anderen Einheiten gesendel werden, 

b) nur an die direkt tibergeordnete Einheit geseodet werden, 

c) nur an die direkt untenjeordnet(n) Einheiten) gesendet werden 

d) an eine bestimnite, adressierte Enheit gesendet werden. 

10. Verfahren nach Anspruch 1 bis 9, dadurch gekennzeichnet, daB die Hnheiten hierarchisch in einer Baumstruk- 
tur angeordnet sind. 

11. Verfahren nach Anspruch 1 bis 10, dadurch gekennzeichnet, daB die hochste Einheit in der Baumstruktur einen 
gemeinsamen Speicher mit einem ubergeordneten Rechner teilt und der Qbergeordnete Rechner die Ablaufe in dem 
Baustein fiber Komnuirrikation mit der ubergeordneten Einheit steuert 

12. Verfahren nach Anspruch 1 bis 11, dadurch gekennzeichnet, daB Einheiten mittlerer und bbchster Hierarcbie- 
ebene neben gewohnlichen Anforderungen (Trigger) auch auf Anforderungen von IDs reagiereu, wobei die tJber- 
setzung der ID in die Adresse der Speicherstelle der referenzierten Konfigurationsroutine erfolgt und die Uberset- 
zung eines Triggers in eine ID entrallt. 

13. Verfahren zum Cachen von Daten und Befehlen in aus mehreren Rechenwerken bestehenden rVGkroprozesso- 
ren und in Bausteinen mit zwei- oder mehrdimensionaler Zellanordnung (z. B. FPGAs, DPGAs, DFPs gemaB 
DE 44 16 881 Al, o. dgl.), dadurch gekennzeichnet, daB 

13.1 mehrere Zellen und Recbenwerke (CEL) zu einer Mehrzahl von Gruppen zusarnmengefaBt werden, wo- 
bei jeder Teilgruppe ein Cache (CT) zugeordnet ist, 

132 die Caches der einzelnen leilgruppen werden uber eine Baumstruktur an einen ubergeordneten Cache 
(ROOT-CD geschaltet, der ZugrifT auf einen Speicher (ECR) besitzt, in dem die Daten/Betehle abgelegt sind, 

13.3 jedcr untcrgeordnetc Cache oder Cache auf mittlerer Ebcne des Baumcs fordert die benoligten Daten/Be- 
fehle bei dem jeweils ubergeordneten Cache an, 

13.4 die Daten werden Uber einen VVrite-Through-Mechamsmos an die Ubergeordneten CJs und in den Spei- 
cher (ECR) geschrieben werden, 
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13.5 die Daten werden wahrend des Zugriffes durch cine KR/EKR in alien Cft durch Eintragen derlD der be- 
irefifenden XR/TKR in das CTR/ECR als "ungultig" markiert, 

13.6 beimROckscbxeiben der Daten wild die ID in dem zusaizlichenEiatrag des CTR7ECR gekfecht, woduicfa 
die Daten als gulug maikiert sind. 

14. Verfahren zum Arbitrieren von Daten dadurch gekermzeichnet, dafl 5 

14. 1 die zu arbitrieienden Sign ale uber eine Maske auf eioen Round- Robin-Arbiter geleitet werden, wobei der 
Grundzustand der Maske alle Signale durchschaltet, 

14.2 der Arbiterausgang gibt das arbitrierte Signal an, 

143 das arbitrierte Signal wird so dekodiert und auf die Maske zuruckgefuhrt, daB das Signal und alle anderen 
honerpriorisierten Signale von der Maske gesperrt werden, to 
14.4 ist das Ietzte Signal arbitriert oder es existiert kein von der Maske frexgeschaltetes Signal, das eine Arbi- 
trieruog anfordert, wird die Maske koraplett rreigescbaltet 
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